A DeepSeek után egy újabb kínai modell robbanthat be a piacra | 24.hu


Az Alibaba, a kínai technológiai óriás, nemrégiben bemutatta legújabb mesterséges intelligencia modelljét, amely állítólag meghaladja a versenytársak, például az OpenAI, a Meta és a DeepSeek által kifejlesztett rendszereket is. A LiveScience híradása szerint ez az új fejlesztés új szintre emelheti az AI technológia alkalmazásait.

A Qwen2.5-Max modell január 29-i bejelentése újabb mérföldkő a mesterséges intelligencia világában, és máris a második jelentős hír érkezik Kínából ezen a héten. Az amerikai technológiai cégeket meglepte a DeepSeek R1 nevű érvelő modell, amely gyorsabb és költséghatékonyabb tanítási módszerével kiemelkedett a mezőnyből. Érdekes módon, a hírek szerint a ChatGPT által generált szintetikus adatok is szerepet játszottak ennek a modellnek a fejlődésében.

Az Alibaba legújabb bejelentése szerint a részben nyílt forráskódú Qwen 2.5-Max lenyűgözőbb teljesítményt nyújt, mint a versenytársának számító másik kínai fejlesztés.

Az olyan benchmark tesztekben, mint az Arena-Hard, a LiveBench, a LiveCodeBench, a GPQA-Diamond és az MMLU-Pro, a Qwen2.5-Max egyenrangú az Anthropic Claude-3.5-Sonnetjével, és felülmúlja az OpenAI GPT-4o modelljét, a DeepSeek-V3-at és a Meta Llama-3.1-405B fejlesztését

- közölték az Alibaba képviselői a WeChat platformjukon.

A DeepSeek sikere nyilvánvalóan nem csupán az amerikai technológiai színtéren, hanem Kínában is jelentős változásokat hozott: az Alibaba mellett a TikTok mögött álló ByteDance is frissítette Doubao modelljét. Jelenleg azonban még kérdéses, hogy a nyugati közönség mikor ismerheti meg ezeket az újításokat.

Related posts