okx

上海建设青年发展型城市|开发能处理文本的AI文秘,80后博士陈运文驶入人工智能新赛道

上海 人工智能

青年报首席记者 范彦萍

企业个人递交信息审批流程很长,财务报告繁杂财务们看花眼……类似这样的文本处理,以前都要花许多人力来处理,但有了“AI文秘”机器人,它们能快速阅读分析大量重复枯燥的文本,为企业、政府部门、专业人士减负。

上海张江浦东软件园有一家人工智能文本处理企业——达观数据是该赛道的“独角兽”,创始人陈运文是复旦大学计算机博士和杰出毕业生。曾先后担任百度核心技术研发工程师、盛大文学首席数据官、腾讯文学高级总监等职的他有一天突发奇想,既然AI能在文学领域发力,为何不能将它们的技能应用到其他诸如金融、制造、物流、能源、政府、医药等垂直领域呢?

预测未来10年之内

50%的日常文档处理将由机器人完成

80后博士陈运文的创业梦始于2015年,就在“大众创业、万众创新”的时代背景下,他脱离了打工人角色,创办了专注于智能文本处理的公司——达观数据。

创业初期,陈运文组建了一个算法团队,人不多,却颇有实力。在参加ACM CIKM 算法竞赛和EMI Hackathon 数据竞赛两大国际赛事时,团队成员分别拿下了赛事的全球冠军。

公司的第一间办公室位于张江天之骄子(孵化器),面积只有约二十个平方米。达观的第一行代码,就是在这个弹丸之地写出来的。

7年,几百万行代码!这些年,陈运文和团队的工作一直围绕着“人工智能”和“文本处理”,不断精进文本智能处理,为企业提升效率而努力。

曾经的工作经历让他对文字处理尤其敏感,在创业界有一个法则是“做熟不做生”。陈运文告诉记者,以前他所就职的公司主要是将AI应用于小说、剧本等文本的处理。但他发现,诸如金融、政府行政部门等行业的人工智能文本处理尚处于空白,“因此,我们开发的机器人就聚焦政府公文、大型企业报告等文本的处理,切中客户的刚需”。

但所谓隔行如隔山,这样的定律对于机器人来说也是一样的。陈运文形容说,自己啃的是块硬骨头。达观所从事的自然语言处理领域相较传统的领域,特点是技术难度更高、应用价值更大。比如替财务处理财务报表、自动对账、写报告、报税等金融工作;替信贷员做银行信贷审核贷款、撰写贷后管理报告等;替证券从业人员写证券说明书、招股说明书,处理企业合同、订单、用户手册等;替政府工作人员做行政审批。“打个比方,以前为何企业办证要一个月,因为需要靠人去查很多资料,但AI系统处理的话可以大幅提高效率,甚至做到秒批。”

“我们落地场景的难点在于实际应用中的文字语义变化多端,蕴含的行业知识庞杂。其实在金融、制造、物流、能源、政府、医药等领域里,文字资料的审核、比对、搜索、写作、报送等都大量存在。”陈运文介绍说。

“虽然研发过程困难但是应用前景是巨大且广阔的。”陈运文预计,在未来10年之内,50%的日常文档处理工作将由计算机完成。

“让计算机系统代替人类来处理办公文字”是陈运文创业之初就立下的目标,他希望未来公司能将人从日常繁琐的文字工作中解放出来,去做更有意义、更有价值的工作。

经过多年的努力,达观的团队已发展成600多人的企业,成为这一赛道的明星企业。

坚持自主创新

积极研发国产GPT“曹植”大模型

从2023年开始,陈运文敏锐地意识到这是人工智能进入新阶段的大年。行业内有句话,自然语言理解是人工智能皇冠上的明珠。陈运文之前估计,人工智能的水平超过人类,需要5-10年,但现在这一时间进程大大加快,便是得益于ChatGPT的发展。

陈运文解释说,达观所从事的文档资料的智能处理,与ChatGPT的工作原理类似。ChatGPT背后的大模型技术,是通过海量文档资料进行深度学习,智能程度已经达到非常高的水平。不仅能直接给出选择题的答案,还可以帮用户写代码、找bug,写各种各样的文档资料。

达观目前正在积极研发的国产版GPT“曹植”大语言模型LLM系统可以说是站在了ChatGPT“巨人的肩膀”上。“ChatGPT是非常优秀的技术,但它的应用是大众化的,我们产品则应用在企业级领域,面向更为垂直的行业。所以,国产版GPT‘曹植’属于专业版的ChatGPT,比如财务询问非常复杂的财务问题,我们的系统也可以定向答复。”陈运文解释说,作为垂直、专用、自主可控的国产版ChatGPT模型,GPT“曹植”可以针对金融等垂直行业来开发特定应用;系统可以为每个客户量身定制、私有化部署,确保数据安全私密;坚持原创自主,训练数据和算法模型自主可控。

不仅如此,该系统还结合先进的自然语言处理(NLP)、智能文档处理(IDP)、光学字符识别(OCR)、机器人流程自动化(RPA)、知识图谱等技术,为大型企业和政府机构提供文档智能审阅、文档智能写作、知识搜索与问答、办公流程自动化等智能文本机器人产品。达观数据通过持续投入研发和创新,不断提升产品和服务的质量与效率,为企业提供更好的文本智能化解决方案,让计算机协助人工完成业务流程自动化。

近期达观研发新的“曹植”大语言模型系统,让陈运文也对达观大语言模型的应用前景有了更多期望,他希望在专用语言模型方面有所突破,为我国国产大模型的建设也能添砖加瓦。

寻找专业合作伙伴

注重人才与客户服务

“创业像跑一场无止境的马拉松。”在陈运文看来,一旦选择创业,就要做好打持久战的准备,这个过程非常漫长和崎岖,所谓“进窄门、走远路、见微光”,要选择一个自己认定的方向,不随大流;要目光长远,始终保持热情和信念,克服各种困难。

“我们不缺客户,这些年,客户们提了很多要求,难度有高有低。有些非常难的任务需要我们持续做技术研发。”陈运文举例说,有的客户希望“AI文秘”能快速把中文报告自动转变成各种语言的报告,且行文流畅。这对于研发团队提出了很高的要求。

除去核心技术产品的研发,陈运文还十分注重培养技术和业务双结合的人才。因此,他在达观设置了行业专家团队,构成人员均为各行各业的资深从业者,他们与技术工程师配合,让工程师听懂业务专家描述的技术概念,再把这些概念变成计算机的程序代码,让机器人学习,从而实现技术更好地落地。

他也注重技术和产品的交付和客户服务。因为交付质量和客户服务是企业的生命线,是企业行业口碑的来源。大模型技术要转化为优势的产品和服务,才可以真正为企业赋能,如果是面向企业服务,还要考虑不同企业和客户的繁琐需求,和客户共同探索新场景的应用,共同沉淀项目成果。

他还和全国各大财经类高校合作。“很多高校的教授对财务知识很精通,但对人工智能技术不是很了解。我们积极和高校开展专业领域的产学研合作,也和高校合作培养复合型人才。”

创业7年,陈运文获得的荣誉很多,有中国五四青年奖章、上海市十大青年科技杰出贡献奖等,他是国际计算机学会(ACM)和中国计算机学会(CCF)高级会员,中国人工智能学会和中文信息学会专委会委员,兼任复旦大学和上海财经大学校外研究生导师;在人工智能领域有丰富的研究成果,申请有30余项国家发明专利,多篇会议论文发表在高水平国际期刊上。他还带领达观数据荣获工信部专精特新“小巨人”企业、2018中国人工智能界最高奖“吴文俊人工智能奖”。

青年报首席记者 范彦萍

相关内容

扎实推动高质量发展在湖南农信系统落地生根

洪 樱 成依潇 刘雯娟 黄利飞 新型农业经营主体贷款余额177.2亿元,累计涉农贷款余额达6264.5亿元; 普惠型小微企业贷款余额达2182亿元,支持普惠型小微企业户数50.8万户; 新版手机银行客户数1244万户,收单商户数79万户,线···

全国港口前三季度吞吐量出炉

1-9月,全国港口集装箱吞吐量前10名分别是:上海港(第1)、宁波舟山港(第2)、深圳港(第3)、青岛港(第4)、广州港(第5)、天津港(第6)、厦门港(第7)、苏州港(第8)、北部湾港(第9)、日照港(第10)。图片来源于港口圈1-9月,···

定安打出组合拳推动知名企业纷纷落地

海南日报记者 李豌 特约记者 孙国富蜜雪冰城全球供应链总部基地和全国冷链物流总部基地项目、煌上煌集团……近年来,大企名企纷纷落地定安。国际投资单一窗口综合管理系统数据显示,2020年5月至今年9月,定安县在库项目36个,签约金额达158.9···

45年·45人·45个典型改革案例丨熊维政:一定要把信阳茶油做上市

□本报记者 胡巨成 刘宏冰潜心医药行业40余年,将一家作坊式医药小厂,做成大别山革命老区和全国贴膏剂药业首家上市企业,打造出“百亿级贴膏剂生产基地”的羚锐制药前“掌门人”熊维政,在他60岁时急流勇退,放手交棒,转身创办了信阳信锐油茶股份有限···

山东区划设想,二分滨州,组建渤海市,利津改区,邹平与高青互换

近年来,随着我国产业结构的不断调整,经济增长方式也在持续优化,特别是随着交通等基础设施的完善,区域经济开始朝着一体化发展方向迈进。如果用《射雕英雄传》中的一句话来形容,江苏是“东邪”、广东是“南帝”、四川是“西毒”,那么山东则是“北丐”,此···

为什么河南经济是最没有希望的?上车,带你深度了解河南的问题

“河南小孩出生就是为了离开河南”,这是我最近一个关于河南经济评论文章下点赞最高的评论。这句话我深深刺痛着自己,因为我自己就是河南人,深知这里面包含了多少无奈和心酸。当人们在聊地域之争的话题时,大家都会为自己的省份争辩几句,然而只有河南人,会···

关注双11丨“88VIP”淘宝天猫全网商品都能用花呗分期免息

2023天猫“双11”活动今晚8点正式开始。今年“88VIP”大额券总规模达到200亿,用户可领券额度最高可达860元。支付宝针对“88VIP”淘宝天猫用户还推出花呗分期免息服务,消费者购买大件商品又多了一重实惠。“88VIP”用户购买单价···

每日新闻,60秒知晓世界热点

2023年10月31日,星期二,农历九月十七1、31省份前三季度人均可支配收入公布:上海北京首超6万元位居全国前列,浙江天津江苏同属4万+梯队紧随其后;长三角万亿城市经济三季报:合肥增速第一,宁波增速超上半年;2、工行、农行、中行、建行、邮···

2024年城乡居民参保调整,一次性补缴5.9万,每月能领2300元吗?

随着时间的推移,社会保障制度也在不断地完善和调整。2024年城乡居民参保也将迎来新的一轮调整。据相关政策规定,未来居民参保需要一次性补缴5.9万,每月能领2300元。这个政策引起了很多人的关注和讨论。对于这个政策,有些人认为一次性补缴5.9···

老百姓:第三季度净利润同比增长32.78% “聚焦发展”战略优势凸显

中证网讯(记者 段芳媛)老百姓10月30日晚间披露2023年第三季度报告。公司前三季度实现营业收入160.42亿元,同比增长16.44%;实现归属于上市公司股东的净利润7.17亿元,同比增长17.54%。其中,第三季度实现营业收入52.31···

紧抓机遇开展差异化竞争 骆驼股份积极开拓国际市场

骆驼股份 黄剑波/供图 彭春霞/制图证券时报记者 韩忠楠越来越“卷”的新能源汽车赛道,既充满挑战,也酝酿着新的机遇。近期,受益于华为与赛力斯联合打造的全新问界M7的热销,与之相关的汽车产业链在A股市场的热度也随之升温。这当中,为问界M5/M···

宝山罗店:罗南二村 半年跌幅近乎恐怖 郊区老破小太可怕

前几天,我们写了几个宝山区二手房系列,美兰湖板块的万科琥珀郡园以半年跌幅近五分之一位列榜首,我以为就是跌幅极限。然后,今天现场去看了位于美兰湖南侧的罗南新村,在那周围详细地看了看,然后比较了一下罗南二村最近成交与4月份左右的成交记录,愕然发···

压倒许家印并不是造车,而是恒大童世界,砸几千亿搞了十几个鬼城

恒大集团以其高调的投资和建设项目而闻名,最近引起了人们的广泛关注。与传统地产业务不同,恒大集团的新尝试是在娱乐旅游领域建设恒大童世界。这一巨大的投资计划引发了广泛的争议和讨论。恒大童世界的建设规模之大令人瞩目。据报道,恒大集团计划投资数千亿···

《人民日报》警告奏效?98款,突破1亿台!华为正式宣布

导语:在科技的浪潮中,华为从遭遇“极限施压”,到芯片突破和鸿蒙生态的自研,始终展现出卓越的技术实力和坚韧不拔的创新决心。华为面对挑战:技术封锁与自主创新在2019年,《人民日报》发送《人民日报评华为遭"极限施压":科技自立,时不我待》一文,···

中国钢铁大王戴国芳,入狱5年东山再起,再造500强民企狂赚1957亿

他从一个收废品的穷小子,摇身一变,登上了中国400富豪榜。他的钢铁厂年销售额已超过1个亿,手下员工超过1千人,他就是钢铁大王戴国芳但是这个钢铁界的王者,却因为一时错误,被捕入狱,还坐了5年牢。出狱后,他不忘初心重操旧业,不仅再次创办炼钢厂,···

油价暴跌倒计时,专家透露:11月国内高油价将消失!

随着外资油站的进入,国内加油站市场的竞争格局正在发生重大变化。近日,多位专家在接受记者采访时表示,预计11月国内高油价将不复存在。这一预测的背后,是外资油站的入驻带来的市场冲击和国内油价的持续波动。外资油站的进入,打破了国内加油站的垄断格局···

共话中国经济新机遇丨专访:中国经济展现出发展韧性

新华社日内瓦10月30日电 专访:中国经济展现出发展韧性——访联合国贸发会议资深经济学家梁国勇新华社记者陈斌杰联合国贸发会议资深经济学家梁国勇日前接受新华社记者书面专访时表示,中国经济今年前三个季度的增长态势展现出了发展韧性和潜力。中国国家···

润达医疗:目前在上海、北京等地区部分医疗机构已开展LDT相关业务的试行

润达医疗近期接受投资者调研时称,目前在上海、北京等地区部分医疗机构已开展LDT相关业务的试行,公司在上海等地区积极和相关部分医疗机构展开合作,共同推进LDT相关业务在医疗机构的开展。未来随着相关政策法规进一步完善,LDT相关业务将给公司带来···

国航率先公布第三季度财报,疫情后首度扭亏

在阅读此文之前,希望用您发财的小手点一下“关注”,文章内容来源于网络但是最后会有小编的个人感悟,如有不足之处可以评论指出,谢谢您的支持。民航行业近期公布的积极消息显示了行业的积极向上趋势。多家航空公司在财报中宣布扭亏为盈,旅客运输量也逐步恢···

竹塑革命!中国发改委推动“以竹代塑”三年行动计划。

近日,中国国家发展和改革委员会发布了一份重要通知,名为《加快“以竹代塑”发展三年行动计划》,这一举措旨在推动“以竹代塑”产业体系的快速建立。这个消息将给与竹制品、造纸等行业密切相关的产业带来利好消息。竹子作为中国特色植物,广泛应用于造纸、包···