(資料圖片)
圖說:活動現(xiàn)場 采訪對象提供
新民晚報(bào)訊(記者 葉薇)為提升語料數(shù)據(jù)供給水平,推動大模型產(chǎn)業(yè)高質(zhì)量發(fā)展加速應(yīng)用創(chuàng)新與行業(yè)落地,由中國大模型語料數(shù)據(jù)聯(lián)盟主辦的數(shù)說新語·開放日首場活動昨天在上海人工智能實(shí)驗(yàn)室舉行。
開放日上,中國專利技術(shù)開發(fā)公司、上海仲裁委員會、上海圖書館(上海科學(xué)技術(shù)情報(bào)研究所)、上海數(shù)據(jù)交易所、上海市社會信用促進(jìn)中心、上海蜜度信息技術(shù)有限公司、上海鈦米機(jī)器人股份有限公司、華東師范大學(xué)出版社有限公司、上海城建城市運(yùn)營(集團(tuán))有限公司9家新成員單位加入“中國大模型語料數(shù)據(jù)聯(lián)盟”,將共同為大模型技術(shù)深度發(fā)展與高水平應(yīng)用提供更多元的數(shù)據(jù)要素保障。聯(lián)盟發(fā)起單位代表為他們頒發(fā)了入盟紀(jì)念證書。
蜜度信息首席技術(shù)官劉益東發(fā)布了開源文本數(shù)據(jù)集蜜巢·花粉1.0,該數(shù)據(jù)集以互聯(lián)網(wǎng)媒體數(shù)據(jù)為主,經(jīng)過過濾清洗、多條件去重等精細(xì)化處理,來源可靠、質(zhì)量高,并可持續(xù)穩(wěn)定更新,截至目前,數(shù)據(jù)總量已超一億條該數(shù)據(jù)集還經(jīng)過了資深律師進(jìn)行了數(shù)據(jù)合規(guī)前置審核。
蜜巢·花粉1.0已被應(yīng)用于蜜度系列大模型的訓(xùn)練,在政務(wù)及媒體等垂直領(lǐng)域提供知識問答與內(nèi)容生成、分析報(bào)告自動生成、文稿內(nèi)容審校與潤色改寫等各類智能生成式服務(wù)。目前,各項(xiàng)服務(wù)已得到了用戶的良好反饋。借此契機(jī),蜜度將進(jìn)一步降低大模型技術(shù)探索和落地的門檻,加速應(yīng)用創(chuàng)新與行業(yè)落地。據(jù)悉,蜜巢·花粉1.0是繼8月14日書生·萬卷發(fā)布以來,聯(lián)盟發(fā)布的第二個開源語料數(shù)據(jù)集。同時,多個聯(lián)盟成員單位也已形成了語料數(shù)據(jù)開源方案,將陸續(xù)進(jìn)入發(fā)布隊(duì)列。
未來,聯(lián)盟將持續(xù)發(fā)揮好“朋友圈”作用,凝聚各方資源,發(fā)揮各成員單位優(yōu)勢,群策群力,共同推動大模型語料數(shù)據(jù)高水平供給,為我國大模型發(fā)展做好數(shù)據(jù)支撐。
關(guān)鍵詞: