Alexey Skobkin: "Я тут немного гонял Gemma 3. …"

Тр3тий Сергеевич @th3rdsergeevich@mastodon.ml

Кстати, забыл написать, что в @ollama 0.6.3-rc0 описанную мной проблему если не починили, то сделали так, что я её ни разу не встретил за вечер экспериментов с Gemma 27B.

Так что если у вас была проблема, то возьмите свежий пре-релиз и попробуйте ещё раз.

CC @th3rdsergeevich

**Тр3тий Сергеевич** @th3rdsergeevich@mastodon.ml · Mar 25 *

Mar 25 *

@skobkin @ollama Звучит вкусно, только пока мой биг-бокс 27В не берет по памяти, на попытке распознать картинку виснет. Правда, все это делал именно что в Ollama, я еще крупную модель не обкатывал в KoboldCpp, надо будет попробовать.

UPD: Вру, имел в виду 12B.

**Alexey Skobkin** @skobkin · Mar 25

Mar 25

@th3rdsergeevich @ollama
Так я ж говорю, там в Ollama сейчас проблемы именно с Gemma по памяти.

Если всё ок, то модель даже если не помещается в VRAM должна хотя бы бегая постоянно между RAM и VRAM медленно работать. Но с Gemma что-то идёт не так и Ollama не может предсказать потребление и начинается ад вроде того что раннер просто крашится или начинает вместо VRAM использовать RAM не загружая память видеокарты как надо.

Так что пробуй 12B или ещё более мелкую версию. Сейчас все так страдают

P.S. А ещё у неё с русским неплохо. Причём вплоть до того, что может даже стих с рифмой написать. Этого от модели на русском я добился впервые - они обычно просто игнорируют рифму, видимо, размышляя английскими токенами и не проверяя результат.

**cycl0ne** @cycl0ne · Mar 25

Mar 25

@skobkin @ollama блин, я как послушал и посмотрел про амдшные AI Max процы с до 128 гигами памяти так не могу перестать облизываться (хотя оно будет стоит стока, что лучше сразу губу закатать)

**Alexey Skobkin** @skobkin · Mar 25

Mar 25

@cycl0ne
Это которые Ryzen AI HX 370 и ко?

**cycl0ne** @cycl0ne · Mar 26

@skobkin не, HX - это Strix Point, а я про Strix Halo (Ryzen AI MAX+) там 40CU и до 128 гигов Unified memory

Ну и АМД как обычно проебалось в нейминге продуктов. как смотришь на модельный ряд "мобильных" процессоров - хочется за голову схватиться.

**Alexey Skobkin** @skobkin · Mar 26

@cycl0ne
Ну это их родня, просто более крутая.
А как там это память работает? Просто NPU и GPU быстрый прямой доступ в RAM?

Я так понимаю, для AM5 подобных процессоров не имеет смысла ждать в том числе из-за специфики по памяти. Я б себе в сервер такое воткнул, конечно.

**cycl0ne** @cycl0ne · Mar 26

@skobkin по идее всяческие mini-pc на них обещают. Но да, быстрый прямой доступ к памяти.

**rayslava** @rayslava · Mar 26

rayslava @rayslava

@cycl0ne но память при этом будет медленная?
В смысле, обычный DDR?
@skobkin

**cycl0ne** @cycl0ne · Mar 26

@rayslava @skobkin медленная, но как понимаю, все же пошустрее обычного получается. 256bit LPDDR5Х, если я всё правильно понимаю.

**rayslava** @rayslava · Mar 26