bartov-e Jan 11 at 17:57Краткий обзор методик обучения визуально-языковых (мультимодальных) моделейLevel of difficultyMediumReading time12 minViews2KMachine learning*Natural Language Processing*ReviewTranslationTotal votes 7: ↑7 and ↓0+7Add to bookmarks37Comments1
Andriljo Jan 11 at 23:13Comment has been editedИнтересный обзор, но CLIP не является декодером текста, возможно что-то не понял в формулировке "CLIP как декодер".
Краткий обзор методик обучения визуально-языковых (мультимодальных) моделей