Hugging Face PEFT๊ฐ LoRA ์ด๋ํฐ ๋ณํฉ์ ์ํด Concatenation, Linear/Task Arithmetic, DARE, TIES 4๊ฐ์ง ๋ฐฉ์์ ์ถ๊ฐํด ๋ฉ๋ชจ๋ฆฌ ํจ์จ์ ์ธ ์จ๋ํ๋ผ์ด ๋ณํฉ ์ง์
๐คย PEFT welcomes new merging methods
AI ์์ฝ
Context
๊ธฐ์กด ๋ชจ๋ธ ๋ณํฉ์ ์ฒดํฌํฌ์ธํธ๋ฅผ ๋ค์ด๋ก๋ํ ํ ๋ณํฉํ๋ ๋ฐฉ์์ผ๋ก ๋ฉ๋ชจ๋ฆฌ ์ง์ฝ์ ์ด์๋ค. ๊ฐ์ ๊ธฐ๋ณธ ๋ชจ๋ธ์์ ์ป์ ์ฌ๋ฌ LoRA ์ด๋ํฐ๋ฅผ ์คํ์ ์ผ๋ก ์กฐํฉํ ๋, ๋ฉ๋ชจ๋ฆฌ ์ ์ฝ ์์์ ๋ค์ํ ๋ณํฉ ์๊ณ ๋ฆฌ์ฆ์ ์ฆ์ ์ํํ๊ธฐ ์ด๋ ค์ ๋ค.
Technical Solution
- Concatenation (cat) ๋ฐฉ์: LoRA ํ๋ ฌ(A, B)์ ๊ฐ์ค์น์ ์ค์ผ์ผ๋ง ๊ณ์๋ฅผ ๊ณฑํ ํ ์ฐจ์ 0๊ณผ 1์ ๋ฐ๋ผ ์ฐ๊ฒฐํ์ฌ ์๋ณธ ์ด๋ํฐ๋ค์ ๊ฐ์ค ๋ณํฉ๊ณผ ๋์ผํ ์ถ๋ ฅ ์์ฑ
- Linear/Task Arithmetic (linear) ๋ฐฉ์: A์ B ํ๋ ฌ์ ๊ฐ์คํฉ์ ๊ณ์ฐํ๋ ๋ฐฉ์์ผ๋ก ๊ตฌํํ๋, ๋ชจ๋ ์ฐธ์ฌ LoRA ์ด๋ํฐ๊ฐ ๋์ผํ rank๋ฅผ ๊ฐ์ ธ์ผ ํจ
- DARE ๋ฐฉ์: ๊ณ ๋ฐ๋(high density) ์ค์ ์ผ๋ก ์คํ์ผ ์ด๋ํฐ ์กฐํฉ ์ ์ฑ๋ฅ ํฅ์
- TIES ๋ฐฉ์: majority_sign_method="frequency" ์ต์ ์ผ๋ก ์คํ์ผ ์ด๋ํฐ ์กฐํฉ ์ ์ต์ ์ฑ๋ฅ ์ ๊ณต
- ์จ๋ํ๋ผ์ด ๋ณํฉ: ์ด๋ํฐ ํ์ฑํ/๋นํ์ฑํ ์ ๋ฉ๋ชจ๋ฆฌ ๋ด์์ ์ค์๊ฐ์ผ๋ก ๋ณํฉ ์ํ
Key Takeaway
๋ค์ํ ํ๋ผ๋ฏธํฐ ํจ์จ ๊ธฐ๋ฒ(LoRA, IA3 ๋ฑ) ๊ฐ ๋ณํฉ ์๊ตฌ์ฌํญ์ด ๋ค๋ฅด๋ฏ๋ก, ๊ฐ ์ด๋ํฐ ํ์ ์ ์ต์ ํ๋ ๋ณ๋์ ๋ณํฉ ์๊ณ ๋ฆฌ์ฆ์ด ํ์ํ๋ค. ๋ฉ๋ชจ๋ฆฌ ์ ์ฝ ํ๊ฒฝ์์๋ ์ฒดํฌํฌ์ธํธ ๋ค์ด๋ก๋ ๊ธฐ๋ฐ ๋ณํฉ ๋์ ์จ๋ํ๋ผ์ด ๋ฐฉ์์ด ์ฌ์ฉ์ ๊ฒฝํ์ ํฅ์์ํจ๋ค.
์ค์ฒ ํฌ์ธํธ
LoRA ์ด๋ํฐ๋ฅผ ์ฌ๋ฌ ๊ฐ ํ์ตํด์ ์กฐํฉ ์คํ์ ํ๋ ํ์์๋ PEFT์ ์๋ก์ด ๋ณํฉ ๋ฉ์๋๋ฅผ ์ฌ์ฉํ๋ฉด ๊ฐ ์ด๋ํฐ๋ฅผ ๋ฉ๋ชจ๋ฆฌ์ ๋์ ๋ก๋ํ ํ์ ์์ด ์ฆ์ ๋ค์ํ ๋ณํฉ ๋ฐฉ์(cat, linear, DARE, TIES)์ ํ ์คํธํ๊ณ ์ต์์ ๊ฒฐ๊ณผ๋ฅผ ์ ๊ณตํ๋ ๋ณํฉ ๋ฐฉ์์ ์ ํํ ์ ์๋ค.