Comments / Profile of riv9231 / Habr

User

Profile Publications Comments 166Bookmarks 35

Шпаргалка для создания идеального промпта LLM

Заметил интересную особенность: Если в самом начале кода вы увидите, что Сodestral:22B нарушила какое-то условие задания или проигнорировала требование, то дальше будет косяк на косяке. Я не дожидаюсь и сразу делаю перегенерацию и если вдруг видно что модель неожиданно учла что-то малозаметное, скорее всего, весь код будет хорошим, но возможные мелкие ошибки, их приходится вылавливать вручную.

Я ожидал, что ошибки будут встречаться равновероятно, но, на самом деле, это не так. Заметно большое различие в качестве решений. Бывает, неудачное начало приводит к тупейшим ошибкам, а бывает, если в начале проскочили абзац без ошибок, дальше идёт всё как по маслу.

Благо, модель работает быстро и можно сразу сделать 5 генераций. Я с 4о не сравнивал, т.к. не ожидаю что она её превзойдёт, мне просто нужен локальный инструмент, но сравнивал с command-r-plus 104B q8_0 - она огромная, а код делает хуже. кроме того, даже в q8 заметно снижение качества, например, модель иногда код не оформляет markdown-разметкой или отступы плывут, по моему это признак того, что нужна меньшая или отсутствующая квантинизация. в fp16 такого нет, но приходится запускать на процессора. У меня 24-яденый AMD EPYC, очень медленно. Там перегенерация не самая удачная идея.

В целом, для всех моделей полезно сначала добиться создания некого упрощенного, но концептуально правильного шаблона, а потом попросить его доработать под более сложные требования и так итеративно, ошибок меньше возникает. С моделью Сodestral:22B я предпочитаю чаще перегенерации делать, заодно выбираю понравившиеся мне приемы, которых в bash она знает много.