電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)AIGC即AI Generated Content,是指利用人工智能技術(shù)來生成內(nèi)容,AIGC也被認(rèn)為是繼UGC、PGC之后的新型內(nèi)容生產(chǎn)方式,AI繪畫、AI寫作等都屬于AIGC的分支。對AIGC來說,2022年被認(rèn)為是其發(fā)展速度驚人的一年。
然而AIGC卻存在它的落地痛點(diǎn),那就是高昂的通用大模型與下游垂直應(yīng)用場景需求的不匹配。最近ChatGPT熱度持續(xù)上升,一方面推動了科技巨頭持續(xù)加大AI投入,另一方面也直接帶動下游付費(fèi)意愿提升,這將進(jìn)一步加速AIGC應(yīng)用落地和商業(yè)變現(xiàn)。
早早從事自然語言處理(NLP)研究
在ChatGPT熱度這波浪潮中,拓爾思受到了不少關(guān)注。拓爾思成立于1993年, 主營業(yè)務(wù)包括人工智能產(chǎn)品及服務(wù)、大數(shù)據(jù)產(chǎn)品及服務(wù)和數(shù)據(jù)安全產(chǎn)品及服務(wù)等。
在AIGC方面,拓爾思圍繞傳媒、政府等垂直領(lǐng)域的語料庫有非常全面的積累,在智能問答、自動寫作或智能寫稿、內(nèi)容播報(bào)、創(chuàng)作智能輔助等方面也有成熟的應(yīng)用場景。
在自動創(chuàng)作方面,公司利用自研互聯(lián)網(wǎng)大數(shù)據(jù)資訊平臺,在大型體育賽事期間對賽事熱點(diǎn)和話題進(jìn)行大數(shù)據(jù)分析和研判,通過AIGC的內(nèi)容自動創(chuàng)作和虛擬數(shù)字人進(jìn)行聯(lián)合,幫助觀眾了解最新賽事盛況。在智能問答方面,公司自主研發(fā)了一款面向中文的智能問答云服務(wù)系統(tǒng),即TRS小思智能問答機(jī)器人。
人工智能包括計(jì)算智能(記憶、計(jì)算),感知智能(語音識別、圖像識別),認(rèn)知智能(語言理解、分析決策),創(chuàng)造智能(想象、創(chuàng)造) 四個(gè)層次。
拓爾思所專注的語義智能位于人工智能的認(rèn)知智能領(lǐng)域,即讓計(jì)算機(jī)來理解人類語言或其他符號表面數(shù)據(jù)內(nèi)含的確切意義,提取出信息或知識,進(jìn)而進(jìn)行推理、分析、決策,達(dá)到、接近或者超過人類的智慧水平。
據(jù)介紹,拓爾思是國內(nèi)最早從事自然語言處理(NLP)研發(fā)的企業(yè)之一,在NLP、知識圖譜、OCR、圖像視頻結(jié)構(gòu)化領(lǐng)域都具備自主可控的底層技術(shù)。
拓爾思自2000年開始自然語言處理和文本挖掘方面的研究,在國內(nèi)推出語義智能的商業(yè)化軟件TRS DL-CKM,并被國內(nèi)外數(shù)以千計(jì)的用戶采用。
TRS DL-CKM人工智能技術(shù)平臺,基于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)開發(fā)了50多個(gè)功能組件,200多個(gè)調(diào)用接口,主要應(yīng)用于智能問答、智能寫作、專題分析、智能文本校對、圖像識別、知識圖譜構(gòu)建以及多語言實(shí)體識別等場景,廣泛應(yīng)用于融媒體、輿情分析、內(nèi)容審核、智慧公檢法、智能風(fēng)控、對話機(jī)器人等多個(gè)領(lǐng)域。同時(shí),TRS DL-CKM也為公司其它產(chǎn)品提供AI技術(shù)支撐。
數(shù)據(jù)產(chǎn)品為信創(chuàng)領(lǐng)域提供保障
對于人工智能來說,數(shù)據(jù)作為主要的生產(chǎn)要素,在產(chǎn)業(yè)鏈中占據(jù)重要的位置。以ChatGPT為代表的AIGC大模型技術(shù)對數(shù)據(jù)更是有更高的要求。在數(shù)字化發(fā)展的當(dāng)下,國家對數(shù)據(jù)的重視程度也在加大。
日前,根據(jù)國務(wù)院關(guān)于提請審議國務(wù)院機(jī)構(gòu)改革方案的議案,組建國家數(shù)據(jù)局。負(fù)責(zé)協(xié)調(diào)推進(jìn)數(shù)據(jù)基礎(chǔ)制度建設(shè),統(tǒng)籌數(shù)據(jù)資源整合共享和開發(fā)利用,統(tǒng)籌推進(jìn)數(shù)字中國、數(shù)字經(jīng)濟(jì)、數(shù)字社會規(guī)劃和建設(shè)。足見數(shù)據(jù)在數(shù)字經(jīng)濟(jì)社會發(fā)展中的重要性。
一般而言,數(shù)據(jù)供方包括數(shù)據(jù)產(chǎn)生者、數(shù)據(jù)控制者、數(shù)據(jù)運(yùn)營者。未來數(shù)據(jù)運(yùn)營者匯集數(shù)據(jù)生產(chǎn)者、數(shù)據(jù)控制者的數(shù)據(jù),并對數(shù)據(jù)進(jìn)行存儲、處理,形成高價(jià)值的源數(shù)據(jù)和數(shù)據(jù)衍生品,通過交易系統(tǒng)與需方達(dá)成交易,通過平臺接口傳輸數(shù)據(jù)給需方。
根據(jù)數(shù)據(jù)來源的不同,可分為單源數(shù)據(jù)交易平臺模式和多源數(shù)據(jù)交易平臺模式。根據(jù)數(shù)據(jù)處理程度不同,該模式可分為源數(shù)據(jù)交易模式、數(shù)據(jù)衍生品交易模式以及綜合數(shù)據(jù)交易模式。
拓爾思在數(shù)據(jù)供應(yīng)環(huán)節(jié)和數(shù)據(jù)服務(wù)環(huán)節(jié)都有深度布局。在數(shù)據(jù)供應(yīng)方面,拓爾思基于自主建設(shè)的大數(shù)據(jù)中心,以長期服務(wù)多行業(yè)用戶的開源數(shù)據(jù)持續(xù)累積為基礎(chǔ),建成了具有高商業(yè)價(jià)值的可運(yùn)營大數(shù)據(jù)資源,擁有了規(guī)模及質(zhì)量均位列業(yè)界前茅的海量豐富、已經(jīng)過清洗和脫敏的數(shù)據(jù)資產(chǎn)。
據(jù)介紹,目前拓爾思擁有來自境內(nèi)外、各行各業(yè)的公開數(shù)據(jù)資產(chǎn)總量超 1200億,并已具備數(shù)千億數(shù)據(jù)量的數(shù)據(jù)索引、標(biāo)記、查詢、挖掘分析能力,日均億級數(shù)據(jù)獲取能力。其不僅支撐公司多個(gè)專業(yè)化的數(shù)據(jù)智能服務(wù),也具有對外的開放接口服務(wù),可支撐面向政府、媒體、金融、公安、商業(yè)等多行業(yè)用戶的大數(shù)據(jù)云服務(wù)。
在數(shù)據(jù)服務(wù)環(huán)節(jié),該公司具備完全自主研發(fā)的大數(shù)據(jù)基礎(chǔ)平臺和TRS人工智能平臺,可提供數(shù)據(jù)采集、清洗、標(biāo)注、管理等服務(wù)。具體產(chǎn)品包括海蜘分布式采集系統(tǒng)、海匯社交視頻采集系統(tǒng)、海聚數(shù)據(jù)融合系統(tǒng)、海貝搜索數(shù)據(jù)庫等。
具體來看,其產(chǎn)品海貝數(shù)據(jù)庫是目前國內(nèi)少有從底層數(shù)據(jù)收集,到分詞和索引算法,以及儲存技術(shù)的國產(chǎn)數(shù)據(jù)庫引擎。其核心代碼自主率達(dá)到100%,且通過多家國家機(jī)構(gòu)認(rèn)證,可徹底擺脫對 Elasticsearch和Lucene等國外數(shù)據(jù)庫的技術(shù)依賴。
在大數(shù)據(jù)領(lǐng)域,拓爾思突破異構(gòu)數(shù)據(jù)對大數(shù)據(jù)搜索引擎的限制,為索引數(shù)據(jù)加密提供全方位安全保障,實(shí)現(xiàn)了文本、圖像特征、二進(jìn)制的統(tǒng)一索引和跨數(shù)據(jù)類型跨語言的檢索,并采取最新的集群技術(shù)提高了可支持的數(shù)據(jù)規(guī)模和多用戶并發(fā)檢索性能,為數(shù)據(jù)安全和信創(chuàng)領(lǐng)域應(yīng)用提供全面保障。
小結(jié)
2022年AIGC經(jīng)歷了飛速發(fā)展的一年,新年初ChatGPT的爆火更是將AIGC推向了新高度,讓AIGC的落地商用加速。這也讓一些AI企業(yè)火出了圈,比如拓爾思。其一是其在自然語言處理(NLP)方面的研究,以及其AIGC在多個(gè)領(lǐng)域的成熟應(yīng)用;其二是它在AI產(chǎn)業(yè)鏈主要環(huán)節(jié)數(shù)據(jù)方面的深厚積累,在數(shù)據(jù)方面可以為信創(chuàng)領(lǐng)域提供服務(wù)。
-
智能
+關(guān)注
關(guān)注
8文章
1704瀏覽量
117427
發(fā)布評論請先 登錄
相關(guān)推薦
評論