中国大模型语料数据联盟开源发布高质量多模态语料“书生·万卷”

(相关资料图)

继今年7月在2023世界人工智能(161631)大会发起成立“中国大模型语料数据联盟”，上海人工智能(161631)实验室于8月14日宣布，联合语料数据联盟成员单位，共同开源发布“书生·万卷”1.0多模态预训练语料。“书生·万卷”1.0目前包含文本数据集、图文数据集、视频数据集三部分，本次开源的数据总量超过2TB。该语料数据包含超过5亿个文本，2200万个图文交错文档，1000个节目影像视频，具备多元融合、精细处理、价值对齐、易用高效等四大特征。(上证报)

推荐内容

中国大模型语料数据联盟开源发布高质量多模态语料“书生·万卷”

中核钛白：拟不超9.36亿元收购双阳磷矿、新天鑫化工100%股权

天赐材料：拟发行GDR募资不超过59.8亿元

ST阳光城：公司股票已被深圳证券交易所决定终止上市

乐心医疗：上半年净利润同比增长25.60%

英飞特：上半年亏损6423万元 同比转亏

阿斯利康：加码中国投资 夯实在鲁生产供应

沪上阿姨发展模式受争议，6900家店估值仅40多亿

海宁皮城2022年年度每10股派0.45元 股权登记日为8月21日

未经妻子同意 男子炒股“血亏” 法院这样判→

苑东生物：拟1亿元-2亿元回购股份

沃尔核材：拟在青菱都市工业园投资建设洪山区新能源产业园项目

盟升电子：上半年净利同比增208.91%

雷军2023年度演讲

全聚德：上半年净利润2792万元

大连电瓷：拟定增募资不超2亿元 控股股东和实控人认购

北京商报评论：A股也可以考虑取消印花税

可租可买，可充可换，20 万元起的飞凡 R7 要降维打击？

中秋节、国庆节连休8天！酒店、机票国庆期间预订火爆

登康口腔：控股股东80%股权拟无偿划转给重庆渝富控股

常熟银行业绩快报：上半年净利同比增长20.73%

中国中冶：1-7月新签合同额8015.7亿元 同比增10.6%

金冠电气：中标7250万元国家电网特高压项目

抖音新成立一个文娱部门，整合直播节目、音乐等多个业务

大族数控：上半年净利润9544万元 同比降72.92%

川仪股份：股东水务环境控股80%股权拟无偿划转给渝富控股

特斯拉：已在中国建立数据中心，所有中国大陆市场车辆数据存储在境内

上海将发行31.5亿元棚改专项债

飞龙股份：近日收到某公司的《供应商定点意向书》

终于让梦想窒息了 FF正式交付首辆FF 91

联系名词解释是什么（联系名词解释）

为给警察叔叔敬个礼 他反复练了好几个小时

新国都：上半年净利润3.33亿元 同比增71.04%

中远海特：拟向香港子公司增资1.5亿美元或等值人民币

贵广网络：控股股东贵州广播影视投资有限公司与贵州省多彩贵州文化创意产业博览会有限公司签署《股份转让合同》

中泰证券业绩快报：上半年净利润16.4亿元

京山轻机：全资子公司晟成光伏与客户A签署了日常经营销售合同

常熟银行业绩快报：上半年净利润14.5亿元

韦尔股份于北京投资设立新公司 含物联网技术研发业务

桃李面包：上半年净利同比下降18.46%

北上资金今日净买入中际旭创2.74亿元、立讯精密2.65亿元

印尼高官：马斯克决定未来一年半内推迟特斯拉在全球范围投资

黑龙江省终止省级防汛三级应急响应

2023年上海注册会计师准考证打印时间：8月7日-8月22日

内蒙古自治区总工会深入兴安盟调研指导智慧工会工作

只剩两只公的，它们是最孤独的动物吗？

京东方投资成立科创公司 注册资本8.1亿元

抖音本地团购找达人的话术

集智聚力 推动汽车产业高质量发展

神舟十号简介不超过五十字（神舟十号相关资料）

云从科技：子公司推出内置AI大模型的鼠标产品

多利科技业绩快报：上半年净利同比增34.62%

科大讯飞：将于8月15日发布“讯飞星火认知大模型V2.0”

52度国窖1573提价至980元/瓶？泸州老窖：正在核实

FF正式交付首辆FF 91

潞安环能：7月商品煤销量同比下降3.4%

商务部：研究推动合理缩减外资准入负面清单，进一步放宽外国投资者对上市公司战略投资限制

百联股份：拟出资7116.07万元收购上海商投集团持有的上海百联时尚品牌管理有限公司（即the bálancing买手店）81%股权

南网储能：与北京天启鸿源新能源科技有限公司签订《关于天启鸿源围场共享储能电站项目战略合作协议》

吉祥航空：7月 公司客运运力投入（按可用座位公里计）同比上升66.87%

（体育）全国中医药院校第十五届传统保健体育运动会在津开幕

利物浦昨日对阵切尔西控球率35.1%，渣叔接手后第4少的英超比赛

吸血古堡的惨剧剧本_夜袭吸血古堡

国青集训无缝连接成都大运会 让大运场馆“活起来”

新型减肥神药或有致命副作用：增加患者被麻醉后肺吸入风险

抗洪画卷丨直击子弟兵的日日夜夜

测试两个人的爱情指数（测试两个人的爱情指数）

日本机场发生小型飞机机身着陆事故：着陆瞬间擦出火花

果香鲜爽、酸甜可口，瑞幸咖啡水果冰萃系列开启夏日清爽活力

上市以来涨近50%！AI美容科技公司Oddity(ODD.US)发展前景广阔

盘古智能：公司为风电企业设计的液压站产品已实现批量供货

国内商品期货多数收跌

协鑫能科于内蒙古投资新设储能能源科技公司

中国科学院官方解读韩国室温超导“LK-99”最新进展：复现暂无结论，研究有意义

商务部等9部门办公厅（室）印发《县域商业三年行动计划（2023-2025年）》

商务部等9部门：促进农村大宗商品消费更新换代

特斯拉又降价了！10余个品牌已官宣，最高降价6万！

2023年7月社会融资规模存量统计数据报告

2023年7月金融统计数据报告

英飞特：上半年亏损6423万元同比转亏

阿斯利康：加码中国投资夯实在鲁生产供应

海宁皮城2022年年度每10股派0.45元股权登记日为8月21日

未经妻子同意男子炒股“血亏” 法院这样判→

大连电瓷：拟定增募资不超2亿元控股股东和实控人认购

中国中冶：1-7月新签合同额8015.7亿元同比增10.6%

大族数控：上半年净利润9544万元同比降72.92%

为给警察叔叔敬个礼他反复练了好几个小时

新国都：上半年净利润3.33亿元同比增71.04%

韦尔股份于北京投资设立新公司含物联网技术研发业务

京东方投资成立科创公司注册资本8.1亿元

集智聚力推动汽车产业高质量发展

吉祥航空：7月公司客运运力投入（按可用座位公里计）同比上升66.87%

国青集训无缝连接成都大运会让大运场馆“活起来”

独居老人家中突然失火民警紧急处置化险为夷

理想汽车成立能源服务公司经营范围含AI软件开发

信创板块震荡走强英飞拓、竞业达涨停