Cerebras Systems стартира най-мощната платформа за изкуствен интелект, която конкурира NVIDIA

г. 12:32 ч.
Cerebras Systems стартира най-мощната платформа за изкуствен интелект, която конкурира NVIDIA

Американският стартъп Cerebras Systems, известен със своите иновации в областта на чиповете за машинно обучение, представи новата си платформа Cerebras Inference, която е обявена за най-мощната в света за изводи в изкуствения интелект. Тази платформа, базирана в облака, се стреми да предложи сериозна конкуренция на решенията на NVIDIA, които доминират в момента на пазара.

Cerebras Inference използва ускорителите WSE-3, изработени по 5 nm процес на TSMC. Тези чипове са истински чудовища в света на полупроводниците, съдържайки 4 трилиона транзистора, 900 000 ядра и 44 GB SRAM памет. Това води до впечатляваща обща пропускателна способност на вградената памет от 21 байта/сек и вътрешна междусистемна връзка със скорост от 214 байта/сек. В сравнение, NVIDIA H200 предлага „само“ 4,8 байта/сек, което подчертава значителното предимство на Cerebras.

Според Cerebras, тяхната нова платформа за изводи осигурява до 20 пъти по-висока производителност в сравнение с конкурентните решения, базирани на NVIDIA чипове, в хиперскалерни услуги. В случай на работа с модела за изкуствен интелект Llama3.1 8B, Cerebras Inference осигурява производителност до 1800 токена в секунда на потребител, докато при Llama3.1 70B скоростта достига до 450 токена в секунда. За сравнение, тези стойности при AWS са съответно 93 и 50 токена в секунда, а най-добрият резултат за NVIDIA H100 е 128 токена в секунда за Llama3.1 70B.

Cerebras също така подчертава, че тяхната платформа поддържа 16-битово ниво на точност за целия процес на извод, без да жертва производителността. Това прави Cerebras Inference изключително привлекателно решение за приложения, които изискват висока точност и производителност.

Ценовата политика на Cerebras също е изключително конкурентна, като услугите за извеждане на изводи струват значително по-малко от тези на конкурентите. Например, таксата за обработка на 1 милион токена при Llama3.1 8B е 0,1 долара, а за Llama3.1 70B – 0,6 долара. Таксите се изчисляват на база използваните услуги, което прави платформата достъпна за широк кръг потребители.

Cerebras планира да предоставя услуги за изводи чрез API, съвместим с OpenAI, което означава, че разработчиците, които вече използват модели като GPT-4, Claude или Mistral, могат лесно да мигрират към Cerebras Inference без значителни промени в кода си.

Платформата предлага различни нива на обслужване, включително Enterprise план с персонализирани модели и специализирана поддръжка, както и стандартен Developer Tier с абонаменти от 0,1 USD за 1 милион токена. Наличен е и безплатен достъп на начално ниво с ограничения.

Cerebras Systems вярва, че стартирането на тази платформа ще открие нови възможности за прилагане на генеративен изкуствен интелект в разнообразни индустрии и приложения.
    
Споделете тази новина:



Подобни новини

Изпълнителният директор на Nvidia смята, че изкуственият интелект ще генерира текстури, обекти и герои в игрите

Изпълнителният директор на Nvidia смята, че изкуственият интелект ще генерира текстури, обекти и герои в игрите
Технологията RTX Remix на Nvidia наистина помага за подобряване на качеството на игровите обекти...
 

Asus представи първите графични карти от серията Prime - те отговарят на изискванията на Nvidia за SFF-Ready

Asus представи първите графични карти от серията Prime - те отговарят на изискванията на Nvidia за SFF-Ready
Представените от Asus графични карти GeForce RTX 4060 Ti Prime, RTX 4070 Prime и RTX 4070 Super Prime са оборудвани със системи за охлаждане, които включват по три вентилатора...
 

AMD и Intel се надяват да се конкурират с Nvidia на новия етап от развитието на системите с изкуствен интелект

AMD и Intel се надяват да се конкурират с Nvidia на новия етап от развитието на системите с изкуствен интелект
От друга страна, Nvidia също не бездейства и нейните ускорители все по-често се използват в системите за изкуствен интелект, които включват правене на логически заключения...
 

Технологичните акции отбелязаха спадове - Nvidia загуби 10 процента

Технологичните акции отбелязаха спадове - Nvidia загуби 10 процента
Фондовите пазари в САЩ претърпяха най-големия си спад от октомври 2022 г. насам...
 


 
SetCombG.com новини

Още Новини

YouTube тества нов формат за гледане на дълги видеоклипове като в Shorts
Въпреки възможните ползи за зрителите, тази трансформация, според мнозина, може да доведе до загуба на уникалността на YouTube като платформа Още

Xiaomi пусна 100 000-ия си електрически автомобил само 230 дни след началото на производството
След като в края на март започна доставките на серийни електромобили от дебютния си модел SU7 Още

Instagram ще започне да използва изкуствен интелект, за да открива тийнейджъри, които крият възрастта си
Instagram въвежда нова система, базирана на изкуствен интелект, която ще може да открива тийнейджъри, опитващи се да скрият истинската си възраст Още

Microsoft ще поиска $30 за удължена поддръжка на Windows 10 до октомври 2026 година
Microsoft обяви официално, че обикновените потребители ще могат да продължат да ползват защитни обновления за Windows 10 Още

Серията Call of Duty достига 500 милиона продадени копия – второ място след "Марио"
Activision Blizzard обяви, че продажбите на игрите от популярната военна серия Call of Duty са надхвърлили 500 милиона копия Още