达观动态

达观愿与业内同行分享 助力各企业在大数据浪潮来临之际一起破浪前行

达观“曹植”大模型入选信通院可信AI大模型优秀案例,亦参与编写中国大模型应用标准

近日,杭州通用人工智能论坛在未来科技城顺利举办,在论坛上,国家工业和信息化部重点实验室发布2023可信AI案例大模型研发应用和工具平台优秀案例,达观数据自主研发的“曹植”大语言模型和“曹植”大模型金融领域应用案例成功入选,并受邀参与了中国大模型应用标准的编写工作,达观“曹植”大模型在预训练大模型技术及AI实践领域再获行业认可。

本次论坛由中国信息通信研究院(以下简称中国信通院)、浙江省经济和信息化厅、杭州市人民政府、中国人工智能产业发展联盟共同主办,以“千模竞帆 百态萌生”为主题,聚焦大模型、生成式AI、对话式AI、知识计算、智能决策等多个热点技术,深入探讨相关技术、产品、生态等发展趋势,共促大模型工程化进程,共助生成式AI、对话、搜索、智能决策等可信发展, 进一步支撑人工智能应用创新与产业落地。

作为人工智能三大领域之一的智能文本处理领域的领军企业,达观数据一直致力于推动智能文本处理技术的发展和应用,受邀参与了中国大模型应用体系2.0中的标准《大规模预训练模型技术和应用评估方法 第4部分:模型应用》的编写工作。现场,中国信通院也对大模型标准贡献单位颁发了证书。大模型应用标准是人工智能领域中的重要指导性文件,对于推动行业规范化和标准化具有重要意义。达观数据的参与将为中国大模型应用标准的制定贡献力量,推动人工智能行业的健康发展。

 

曹植大模型

“曹植”大语言模型系统是达观自主研发的国产版GPT,具有垂直、专用、国产三个特性:

  • “垂直”:针对金融、制造等垂直行业来开发特定应用
  • “专用”:系统可以为每个客户量身定制、私有化部署,确保数据安全私密
  • “国产”:坚持原创自主,训练数据和算法模型自主可控

该系统结合先进的自然语言处理(NLP)、智能文档处理(IDP)、光学字符识别(OCR)、机器人流程自动化(RPA)、知识图谱等技术,不仅能实现专业领域的AIGC智能化应用,且可内置在客户各类业务系统中提供专用服务,目前已获得重要技术突破,以大量通用数据和领域数据自监督训练的LLM为基座模型,通过大量通用任务数据和领域任务数据进行Prompt Learning微调,在垂直领域内的理解和生成的任务上都达到了很好的效果。未来,达观将继续致力于人工智能技术与产品的研究与落地。随着技术和产品的发展,人工智能技术与产品将应用到银行、证券、政务、制造等各行业更广更深的工作场景,达观数据也会持续投入相关产品技术研发,深耕行业场景应用,为众多行业持续创造更大的价值。