达观动态

达观愿与业内同行分享 助力各企业在大数据浪潮来临之际一起破浪前行

曹植大模型亮相成都2023AIGC技术创新研讨会,探索行业应用与发展

7月12日,达观数据CSO刘江贤先生受邀出席2023 “数智启新·生成未来”AIGC技术创新研讨会,并与参会嘉宾分享达观数据“曹植”大语言模型。本次研讨会由成都高新区科技创新局、成都高新区数字经济局指导,四川省人工智能研究院主办,围绕AIGC产业技术创新与应用发展,聚集30余位人工智能行业大咖以及20余位来自产学研界专家代表,通过主题演讲、圆桌会议等形式,共同交流、研讨成都AIGC产业技术创新、应用与发展。

 领导致辞 

成都高新区科技创新局相关负责领导在致辞中表示,近年来随着AIGC热度持续高涨,成都众多科技企业、科研团队以及初创公司通过“AIGC+产业”延展业务生态,积极响应“数字中国”建设号召。截至2022年底,成都高新区人工智能集群态势显现,聚集人工智能重点企业370余家,产业规模突破200亿元,同时2022年推动四川省人工智能研究院作为新型研发事业单位落地高新,后续成都高新区将围绕“5+N”产业生态布局,强化科技成果转化,围绕算力、算法和领军人才核心技术突破制定一系列奖补措施,打造好国家新一代人工智能创新发展实验区。

四川省人工智能研究院院长 申恒涛

欧洲科学院外籍院士、电子科技大学计算机与工程学院院长、四川省人工智能研究院院长申恒涛在介绍研究院环节表示,研究院自2023年4月15日正式运营以来得到来自政府及产业界的大力支持,研究院后续将引进战略科学家、创新领军人才以及博士硕士团队,共同围绕国家AI2.0战略整体部署,以汇聚顶级人才、成果转化孵化、科技应用研发、平台产业升级四大定位为发展方向,“瞄准世界科技前沿,推动产业转型升级”为目标,深耕大数据智能、跨媒体智能、人机混合增强智能、自主智能系统四大技术,全力建设成为引领和助推全省人工智能科技及产业发展的研究中心、成果转化中心,打造“政-产-学-研-资-用”深度融合的人工智能产业生态圈,建设四川省人工智能公共技术服务平台,推动全省新一代人工智能科技创新发展。

AIGC大语言模型创新技术与应用人

在主题演讲环节,达观数据首席战略官刘江贤以《AIGC大语言模型创新技术与应用》为题,分享了达观数据在AIGC领域的研究方向和研究成果。

达观数据首席战略官刘江贤主题演讲分享《AIGC大语言模型创新技术与应用》

达观数据自23年3月宣布研发大语言模型以来,一直积极探索大语言模型的专业化、特长化和产品化。通过多年的高质量数据积累,不断精进算法创新,结合多年的文本处理工程实践经验,已开发出具有长文本、多语言、垂直化三大特点的专用国产“曹植”大语言模型。

特点1:长文本

达观数据在长文本处理领域深耕多年,研发的“曹植”大模型特别擅长做长文档的写作、审核、润色、翻译等。“曹植”通过其卓越的自动化写作能力,可准确完成多类型、复杂结构的长文本写作,自动起草多种类型的文档,轻松应对长篇大论的要求。无论是白皮书、技术报告还是品牌故事,“曹植”大模型都能为客户提供高质量、流畅的文案撰写服务。

“曹植”大模型独特的专业性报告写作能力

长文本最大的难点在于文档内存在诸多复杂结构元素,如文本、图片、表格、数据图、标题、段落、页眉页脚、摘要等版面元素,以及跨多个文档间存在复杂关系,还需解析各类复杂格式,如PDF、PPT、Excel、Doc,扫描图片等;为提升长文本写作专业性,达观专门训练了多模态AIGC生成能力,可自动生成表格、图表、数据等元素。“曹植”同时拥有其杰出的多语言写作和翻译能力,使得用户在不同语言环境下都能得到高质量的文案服务。无论需要撰写一篇英文论文、一封法语商业邮件,或者对一篇日文新闻进行翻译,“曹植”都能帮助用户轻松应对各种语言挑战。

特点2:多语言

“曹植”大模型多语言写作能力

多语言翻译最大特色是在翻译的同时可以对原文的标题、段落等内容实现 1:1版式还原,无需更改格式,提供实时的翻译体验,广泛应用于多语言文档密集处理场景。

“曹植”大模型多语言 1:1版式还原翻译能力

特点3:垂直化

大模型不只有“一问一答”的产品形态,需要和垂直行业应用充分结合,只有和行业应用充分结合,才能解决企业实际的问题。“曹植”可针对不同行业开发特定应用和训练专属数据库,使用海量训练数据进行“曹植”大模型的预训练,生成具备基础语言能力和垂直应用能力的模型;支持个性化定制,本地服务器私有化部署,独家提供监督精调服务,以加强垂直领域专用任务的能力。

“曹植”大模型垂直行业应用能力

加强“曹植”大模型垂直领域专用任务的能力

研讨会上,四川省人工智能研究院院长申恒涛、百度智能云政务与泛科技研究院院长叶航晖、成都智算中心常务副总经理谢一明、英诺天使基金合伙人卢健、成都市大数据与人工智能高研院总经理刘媞等多位专家学者,也围绕研讨会主题从AIGC技术发展、应用落地、人才培育、投资、伦理等方向进行了主题分享。

圆桌讨论 

在圆桌会议环节,成都考拉悠然、创新工场、成都市人工智能产业生态联盟、四川观察、四川省人工智能研究院、西南财经大学人文与艺术学院、西南交通大学前沿科学研究院等行业机构代表围绕“AIGC技术创新应用与发展”的主题展开了深度探讨和交流,现场氛围热烈。

在AIGC技术与应用落地层面,与会专家们认为,未来随着AIGC技术不断发展与突破,生成式人工智能在某种程度上可能将成为地区新的细分主导产业。

达观数据也将持续积极研发升级“曹植”大语言模型,探索大语言模型在垂直领域更加更广泛的应用和更广阔的发展空间,全面提升大模型能力,促进大模型企业级应用落地进程。