Binance Square

computeefficiency

Просмотров: 220
2 обсуждают
koinmilyoner
--
Рост
См. оригинал
Превращение моделей ИИ в супермоделей: почему Fleek играет в настоящую игру вывода ИИ не теряет скорость, потому что глуп. Он теряет скорость, потому что мы воспринимаем вывод как хостинг, а не как инженерную задачу. Вот здесь и появляется Fleek, и честно говоря, они瞄准ают на правильный уровень стека. Большинство платформ увлекаются размером модели, количеством GPU или блестящими показателями. Fleek идет глубже. Глубже, почти в духе старой школы. Они воспринимают вывод как задачу компиляции и координации оборудования, а не как улучшенный обёртыватель API. Вот ключевая мысль: Не каждому слою нужна одна и та же точность. На основе исследований Fleek выяснил, что плотность информации варьируется в зависимости от архитектуры модели и слоёв. Поэтому вместо того, чтобы принудительно устанавливать одинаковую точность повсюду (что лениво, давайте будем честны), Fleek измеряет информационный объём на каждом слое и динамически назначает точность. Что это значит? Вы получаете вывод в 3 раза быстрее, затраты на 75% ниже, а качество не страдает — не за счёт упрощений, а за счёт устранения потерь. Вот где дело становится интересным. Путём тесного контроля точности, планирования и выбора ядер Fleek получает прирост производительности, который большинство фреймворков для вывода структурно игнорируют. Не потому что они не способны, а потому что они изначально не были спроектированы так, чтобы думать именно так. Если этот подход масштабируется, это будет не просто оптимизация. Это сдвиг в подходе к построению вывода. Мы уже много лет накладываем всё более крупные модели на неэффективные каналы, надеясь, что грубая сила оборудования спасёт нас. Fleek меняет эту логику. Оптимизируйте путь выполнения, и вдруг та же модель начинает работать как супермодель — стройнее, быстрее, умнее. Иногда прогресс — это не делать больше. Это наконец-то делать всё правильно. #AIInference #ComputeEfficiency #FleekAI
Превращение моделей ИИ в супермоделей: почему Fleek играет в настоящую игру вывода

ИИ не теряет скорость, потому что глуп.

Он теряет скорость, потому что мы воспринимаем вывод как хостинг, а не как инженерную задачу.

Вот здесь и появляется Fleek, и честно говоря, они瞄准ают на правильный уровень стека.

Большинство платформ увлекаются размером модели, количеством GPU или блестящими показателями. Fleek идет глубже. Глубже, почти в духе старой школы. Они воспринимают вывод как задачу компиляции и координации оборудования, а не как улучшенный обёртыватель API.

Вот ключевая мысль:

Не каждому слою нужна одна и та же точность.

На основе исследований Fleek выяснил, что плотность информации варьируется в зависимости от архитектуры модели и слоёв. Поэтому вместо того, чтобы принудительно устанавливать одинаковую точность повсюду (что лениво, давайте будем честны), Fleek измеряет информационный объём на каждом слое и динамически назначает точность.

Что это значит?

Вы получаете вывод в 3 раза быстрее, затраты на 75% ниже, а качество не страдает — не за счёт упрощений, а за счёт устранения потерь.

Вот где дело становится интересным.

Путём тесного контроля точности, планирования и выбора ядер Fleek получает прирост производительности, который большинство фреймворков для вывода структурно игнорируют. Не потому что они не способны, а потому что они изначально не были спроектированы так, чтобы думать именно так.

Если этот подход масштабируется, это будет не просто оптимизация.

Это сдвиг в подходе к построению вывода.

Мы уже много лет накладываем всё более крупные модели на неэффективные каналы, надеясь, что грубая сила оборудования спасёт нас. Fleek меняет эту логику. Оптимизируйте путь выполнения, и вдруг та же модель начинает работать как супермодель — стройнее, быстрее, умнее.

Иногда прогресс — это не делать больше.

Это наконец-то делать всё правильно.

#AIInference #ComputeEfficiency #FleekAI
Войдите, чтобы посмотреть больше материала
Последние новости криптовалют
⚡️ Участвуйте в последних обсуждениях в криптомире
💬 Общайтесь с любимыми авторами
👍 Изучайте темы, которые вам интересны
Эл. почта/номер телефона