<aside>
๐ Goal
- ๋ฐ์ดํฐ ์ฌ์ด์ ์๊ด๊ด๊ณ๋ฅผ ํ์ตํ๊ธฐ ์ํ self-supervised learning์ ๋ํ ๊ฐ๋
์ ์ดํดํจ. ๊ทธ๋ฆฌ๊ณ ์ด๋ฅผ ํ์ฉํ์ฌ Multimodal ๋ฐ์ดํฐ ์ฌ์ด์ ์๊ด๊ด๊ณ๋ฅผ ํ์ตํ๋ ๋ํ์ ์ธ Multimodal Representation Learning ๋ชจ๋ธ๋ค์ ํ์
ํจ. ํนํ, Text-Image ์กฐํฉ์ ๋ํด ์ง์ค์ ์ผ๋ก ์คํฐ๋ํ๊ณ ์ด๋ฅผ ์ธ์ด๋ชจ๋ธ๊ณผ ์ถ์ฒ์์คํ
์ ํ์ฉํ๋ ๋ํ์ ์ธ ๋ชจ๋ธ๋ค์ ๊ณต๋ถํจ
- Multimodal RL์ ๋ํ ํต์ฌ์ ์ธ ๋
ผ๋ฌธ๋ค์ ์ฝ๊ณ ๋ฆฌ๋ทฐํจ
- ํต์ฌ ํค์๋: Siamese network, retrieve-ranker, retrieve-reader, self-supervised, generative/predictive, contrastive, self-distilled, single-stream (similarity search, contrastive learning), dual-stream (cross-attention, joint representation)
- Awesome ๋ฆฌ์คํธ
<aside>
๐ Ground Rule
- ๊ฐ์ ํ ๋น๋ ๋
ผ๋ฌธ์ ์ฝ๊ณ ๊ฐ ์ฃผ์ฐจ์ ํด๋นํ๋ Content ๋ด์ Notion ํ์ด์ง๋ฅผ ๋ง๋ค๊ฑฐ๋ PPT๋ฅผ ๋ง๋ค์ด์ ์
๋ก๋ํจ. ๊ทธ๋ฆฌ๊ณ , ๋งจ ์ ๋๊ธ์ ์๊ฒฌ/์์ฌ์ /๋ด์ฉ ๋ฑ์ 3์ค ์ ๋๋ก ์์ฝ ๋ฐ ์ ๋ฆฌ
- ๊ฐ ์ฃผ์ฐจ์ ๋
ผ๋ฌธ์ ์ฝ๊ณ , ์์ Survey ๋
ผ๋ฌธ๋ค๊ณผ ์ฐ๊ฒฐย ์ง์ดย ์๊ฐํดย ๋ด. ๊ฐ๋ฅํ๋ค๋ฉด ๊ด๋ จ๋๊ฑฐ๋ ํฅ๋ฏธ๋ก์ด ๋
ผ๋ฌธ์ ์ถ๊ฐ์ ์ผ๋ก ์ฐพ์๋ณด๊ณ ์ ์ํจ
- ๋งค์ฃผ ๋ ๋ช
์ ๋ฐํ์๊ฐ ๋
ผ๋ฌธ ํํธ์ฉ์ ํ ๋น๋ฐ์์ ๋ฐํํจ. ์ฐธ์ฌ์๋ ๊ฐ์๋ฅผ ๋ฃ๊ณ ๊ณต๋ถํ๋ ๊ณผ์ ์์ ๊ณต์ ํ๊ณ ์ ํ๋ ์๋ฃ๊ฐ ์๋ค๋ฉด ์์ ๋กญ๊ฒ Materials๋ Resource์ ์ถ๊ฐํ๋ฉด ๋จ
</aside>
๐ฅ Weekly Plan
<aside>
๐ฅ Paper ๊ด๊ณํ์ ์ฐ๊ฒฐ๋ ๋
ผ๋ฌธ์ ํ์ธํ๊ณ , ReadingLog ๊ด๊ณํ์ ๊ฐ์ ํ ๋น๋ ๋
ผ๋ฌธ์ ์ ๋ฆฌํ๋ฉด ๋ฉ๋๋ค.
**** (๋ค์ํ ๋ฆฌ๋ทฐ์๋ฃ๋ค์ ํ์ฉํด ์ดํดํด๋ ๋์ง๋ง, ์ต์ข
์ ์ผ๋ก๋ ๋
ผ๋ฌธ์ ๊ผญ ํ์ธํด๋ณด์ธ์.)
</aside>
Untitled