7月4日,2024世界人工智能大會(huì)(WAIC 2024)在上海世博中心開幕。作為視頻人工智能賽道的先行者,新壹科技受邀參展。當(dāng)天,新壹科技在上海世博展覽館展示了基于新壹視頻大模型的系列產(chǎn)品及應(yīng)用場景解決方案,并正式發(fā)布了新壹視頻大模型2.0版本。
世界人工智能大會(huì)自2018年創(chuàng)辦以來已成功舉辦六屆,WAIC 2024大會(huì)時(shí)間為7月4日—7日,期間,全球人工智能領(lǐng)域的專家學(xué)者和企業(yè)家將圍繞“以共商促共享 以善治促善智”這一主題,分享經(jīng)驗(yàn)、探討前沿AI技術(shù),共同推動(dòng)全球人工智能技術(shù)的應(yīng)用和發(fā)展。
一直以來,新壹科技都秉承“釋放AIGC視頻生產(chǎn)力”的理念,聚焦視頻人工智能的研發(fā)與應(yīng)用,其以新壹視頻大模型為核心,推出了AI原生應(yīng)用平臺(tái)「一幀秒創(chuàng)」、AI數(shù)字人平臺(tái)「新壹數(shù)字人」等AI系列產(chǎn)品及服務(wù)。
目前,新壹科技已在文旅、金融保險(xiǎn)、媒體、營銷、出版、政務(wù)、教育、汽車、醫(yī)療等眾多場景打造了落地方案,大幅提高了各垂直領(lǐng)域的創(chuàng)造力和生產(chǎn)力。諸如金融保險(xiǎn)領(lǐng)域的保險(xiǎn)咨詢客服、數(shù)字人投保顧問;數(shù)字政務(wù)領(lǐng)域的政務(wù)熱線數(shù)字人、政務(wù)大廳的數(shù)字化咨詢臺(tái);傳媒領(lǐng)域融媒體中心開展數(shù)字主持播報(bào)、提升新聞報(bào)道制作傳播效率等,給業(yè)界留下了深刻印象。
值得一提的是,其直播數(shù)字人也在展會(huì)上首次亮相。數(shù)字人主播沒有時(shí)長及精力上限,能7*24小時(shí)不間斷幫助商家實(shí)現(xiàn)流量變現(xiàn)。現(xiàn)下,當(dāng)消費(fèi)降級成為趨勢,中小商家中對價(jià)格敏感度高,對主播表現(xiàn)力要求不高,就適合選用數(shù)字人直播模式來解決。
自2023年發(fā)布國內(nèi)首款聚焦視頻領(lǐng)域的大模型——新壹視頻大模型以來,新壹科技一直持續(xù)對AI視頻領(lǐng)域深入探索。在本次WAIC 2024展會(huì)上,其正式發(fā)布了新壹視頻大模型2.0版,這一版本進(jìn)一步夯實(shí)了其在視頻AI領(lǐng)域的領(lǐng)先地位,也為視頻人工智能在處理、分析、應(yīng)用層面帶來了更多可能性。
據(jù)介紹,新壹視頻大模型2.0進(jìn)一步提升了其多模態(tài)AIGC模型的核心能力,包括多模態(tài)感知能力的強(qiáng)化、實(shí)時(shí)學(xué)習(xí)與自迭代功能升級、多場景交叉推理能力拓展、AI全流程視頻生產(chǎn)能力提升;此外,在短視頻創(chuàng)作能力、真實(shí)場景與人物動(dòng)作模擬等細(xì)節(jié)方面也得到了大幅強(qiáng)化。多層次細(xì)節(jié)的強(qiáng)化和提升,使大模型2.0版本支撐下的視頻生成,更為精準(zhǔn)且適應(yīng)場景更廣泛,賦予用戶更高效、更智能、更細(xì)膩的AI全流程視頻生產(chǎn)體驗(yàn)。
新壹視頻大模型2.0進(jìn)一步增強(qiáng)了其對多模態(tài)信息的感知能力,包括文字、圖片、語音等多種形式輸入。2.0能更精準(zhǔn)理解用戶意圖,為生成更高質(zhì)量視頻內(nèi)容打下堅(jiān)實(shí)基礎(chǔ)。
通過升級機(jī)器算法,新壹視頻大模型2.0在實(shí)時(shí)學(xué)習(xí)和自迭代方面有顯著提升。模型能持續(xù)從用戶反饋和大規(guī)模數(shù)據(jù)中學(xué)習(xí)新識(shí),自動(dòng)調(diào)整和優(yōu)化,以不斷提升視頻生成的效率和精度。
新壹視頻大模型2.0的交叉推理能力進(jìn)一步得到拓展,支持在更廣泛的場景下生成符合要求的視頻內(nèi)容。無論是教育、娛樂、廣告還是其他領(lǐng)域,模型都能根據(jù)需求快速生成符合場景特點(diǎn)的視頻作品
從腳本生成、素材生產(chǎn)和匹配、智能剪輯配音到數(shù)字人播報(bào),新壹視頻大模型2.0讓整個(gè)流程更加智能化,大大減輕創(chuàng)作者負(fù)擔(dān)。模型還升級拓展了素材庫和模板庫,涵蓋更風(fēng)格及行業(yè)領(lǐng)域,用戶可便捷地挑選并融入定制化,輕松創(chuàng)作出具有鮮明個(gè)人特色或品牌調(diào)性的視頻作品。
升級后,秒創(chuàng)AI視頻支持生成更高質(zhì)量、更長時(shí)長的視頻內(nèi)容(如15-30秒),滿足用戶在短視頻創(chuàng)作和分享方面的更多需求;同時(shí),模型還能根據(jù)用戶需求自動(dòng)調(diào)整視頻節(jié)奏、鏡頭切換等細(xì)節(jié),使生成視頻效果更加可控。
此外,新壹視頻大模型2.0在模擬真實(shí)世界復(fù)雜場景和人物動(dòng)作方面也取得新的突破,可以更逼真地模擬出各種場景和人物動(dòng)作,助力用戶生成更生動(dòng)、自然的視頻作品。