&

階躍星辰發(fā)布多模態(tài)理解大模型Step-1o Vision 節(jié)前還將上新更多模型

原創(chuàng)

2025-01-21 19:02 星期二

科創(chuàng)板日報記者黃心怡

①Step-1o系列是階躍星辰研發(fā)的端到端文本、視覺、語音三模態(tài)生成理解一體化模型。
②Step-1o Audio語音模型能力也迎來升級，情商更高，聲音更自然，支持多語種及方言理解。

《科創(chuàng)板日報》1月21日訊（記者黃心怡）既發(fā)布推理模型Step R-mini之后，階躍星辰再發(fā)布Step-1o Vision多模態(tài)理解大模型。

據(jù)了解，Step-1o系列是階躍星辰研發(fā)的端到端文本、視覺、語音三模態(tài)生成理解一體化模型。一個月前，階躍星辰發(fā)布了1o家族的首個模型Step-1o Audio，這也是國內(nèi)首個千億參數(shù)端到端語音大模型。

在Step-1o Vision多模態(tài)理解大模型上線的同時，Step-1o Audio語音模型能力也迎來升級。相對于Step-1V系列多模態(tài)理解模型，Step-1o Vision在視覺識別、感知、指令跟隨、推理等方面進行了提升。而升級后的Step-1o Audio則情商更高，聲音更自然，支持多語種及方言理解，同時實現(xiàn)了更低的時延。

在LMSYS Org發(fā)布的大模型競技場Chatbot Arena最新榜單中，Step-1o Vision在視覺領(lǐng)域位列中國大模型第一，超過所有國內(nèi)大模型公司。