中国电信星辰大模型通过双备案! 52B模型已全面开源

5月15日,根据北京市生成式人工智能服务已备案信息公告,中国电信人工智能研究院(TeleAI)自主研发的星辰大模型已通过备案。今年2月星辰大模型已通过 “境内深度合成服务算法备案” ,“双备案”标志着星辰大模型可正式对外提供生成式人工智能服务。

1.png

TeleAI作为最早布局大模型的央企机构之一,坚持全链路完全自主研发创新,去年便发布了千亿参数“星辰”语义大模型,性能处于国内同级别参数模型的前列。同步构建了语义、语音、视觉及多模态等全模态完备的大模型基础框架,基于星辰大模型的各领域算法已获国际顶会AI竞赛冠亚军24项。TeleAI逐步形成涵盖5大领域的前沿布局:1个智算云底座、1个通用大模型底座、1个数据底座、M个内部大模型、N个行业大模型。

TeleAI积极通过开源推动大模型技术进步和大模型国产化进程。在中国电信CTO、院长李学龙带领下,加快研发创新,接连开源7B、12B、52B参数规模大模型,吸引国内外开源社区开发者广泛讨论和使用,开源模型下载量过万,积累超40W+用户。

本次开源的TeleChat-12B-V2(星辰12B-V2),采用3.7万亿tokens高质量中英文预训练数据进行训练,并在SFT数据部分,针对幻觉、逻辑推理方向数据进行定向提升。在通用问答能力上较之前版本提升5.5%,在多轮数学性能上提升40.3%。

同时,进一步开源更大参数的语言模型TeleChat-52B(星辰52B),52B模型使用更高质量的数据、更科学的数据配比,采用课程学习方式,在通用问答能力上大幅超过12B模型,整体性能比肩甚至超过GPT 3.5-Turbo。本次除了开源chat版本模型外,还开源了基于Deepspeed的全参微调和Lora微调方法,供大模型技术研究者和需求开发者进行自主训练微调模型。据悉,中国电信人工智能研究院表示年内预计将开源千亿级参数大模型,逐步构建全尺寸开源格局,通过更丰富的应用场景、更广泛的落地应用、更繁荣的行业生态,助力中国大模型技术进步与落地应用。

据悉,星辰大模型已广泛应用落地,赋能千行百业转型升级。星辰语义大模型已落地某市民生诉求场景,为市民提供在线文本问答服务,提升政务服务能力,提高市民满意度;语音大模型一体机落地某小学防霸凌项目,星辰语音大模型采用亿级参数进行推理,可在嘈杂环境下,实现报警关键词的精准识别预报警,智能应对各种校园霸凌事件;星辰视觉大模型融入多源跨横态信息,面向公安、县乡综治、基层治理等公共安全管理单位,提供视频图像解析、聚档、视频语义检索等能力,助力智慧城市建设。星辰多模态大模型累计研发15种文生图、55种图生图能力,落地海报生成场景和卡券生成场景。

此外,中国电信凭借在各行业深耕多年的优势和经验,联合头部生态构建了涵盖教育、政务、应急等20多个行业大模型,深入推动大模型与各行各业的融合,切实赋能千行百业转型升级。

星辰大模型通过 “双备案”后,将进一步为客户、生态伙伴、开发者及个人用户等提供前沿的AI能力,赋能千行百业变革的同时也提升个人工作效率和日常生活便利性,切实推进国内AI技术进步及落地应用,加速全社会迈向通用人工智能时代。

TeleChat-52B开源模型链接:https://github.com/Tele-AI/TeleChat-52B   

TeleChat-12B-V2开源模型链接:https://github.com/Tele-AI/Telechat



微信扫描分享本文到朋友圈
扫码关注5G通信官方公众号,免费领取以下5G精品资料
  • 1、回复“LTBPS”免费领取《《中国联通5G终端白皮书》
  • 2、回复“ZGDX”免费领取《中国电信5GNTN技术白皮书
  • 3、回复“TXSB”免费领取《通信设备安装工程施工工艺图解
  • 4、回复“YDSL”免费领取《中国移动算力并网白皮书
  • 5、回复“5GX3”免费领取《R1623501-g605G的系统架构1
  • 7、回复“6G31”免费领取《基于云网融合的6G关键技术白皮书
  • 8、回复“IM6G”免费领取《6G典型场景和关键能力白皮书
  • 本周热点本月热点

     

      最热通信招聘

      最新招聘信息

    最新技术文章

    最新论坛贴子