疫情下,这个上海科技企业致力将人工从繁复的流动信息填报中解放出来

本文转自:上观
疫情至今 , 企业和政府单位每日都面临着大量流动信息填报、核查的工作 , 这些工作辛苦繁琐 , 却又至关重要 。科技改变生活 , 是否能通过科技手段 , 设计一套智慧办公系统 , 将宝贵的人工从这些繁琐又重要的工作中解放出来?这一想法听起来并不困难 , 却涉及到自然语言处理(NLP)这一“人工智能皇冠上的明珠” 。
“上海科技”近日了解到 , 目前 , 由上海科技企业“达观数据”所推出的NLP+OCR+RPA办公机器人 , 已在国内某地区投入使用 , 进行疫情防控辅助工作 。
“未来10年之内 , 50%的日常文档处理工作将由计算机完成 。”达观数据CEO陈运文说 。
01
赛道拥挤 , “自研”是突围关键
今年3月 , “达观数据”完成5.8亿元C轮融资
刷新了中国文本智能处理行业的单笔最高融资记录
对于这一记录的刷新
达观数据CEO陈运文表示:
“这是因为我们做到了赛道之最 。”
RPA(Robotic Process Automation) , 中文名叫机器人流程自动化 , 它之于办公的意义 , 就像物理机器人之于流水线作业的一样 , 赋能机器人 , 替代人工来从事重复且有规律的工作 , 提升工作效率 , 减少人为错误 。这一技术并不陌生 , 在微软office自带的“宏”中 , 就有着它的影子 。
疫情下,这个上海科技企业致力将人工从繁复的流动信息填报中解放出来
文章图片

文章图片

达观数据辅助疫情防控示意图
随着各行各业数字化转型的愈发深入 , RPA赛道近年来持续火热 。在赛道拥挤的当下 , 陈运文为何有自信说“我们做到了赛道之最”?自研技术或许是其突围的关键 。
据采访人员了解 , 市场上大部分RPA产品 , 都建立于微软的.NET框架开发 。而达观数据所推出的RPA产品 , 是国内唯一一款脱离微软.NET框架、拥有完全独立知识产权的RPA产品 , 也正因此 , 达观数据可跨平台解决复杂问题 , 目前该产品已迭代至12.0版本 , 聚焦复杂界面下对目标元素的精准捕获 。在RPA机器人相关的OCR技术(光学字符识别)上 , 达观数据基于自主研发的视觉技术 , 首创无锚点文字提取算法 , 每年产生数以亿计的有效数据 。
【疫情下,这个上海科技企业致力将人工从繁复的流动信息填报中解放出来】02
摘下“人工智能皇冠上的明珠”
意义何在?
传统的RPA产品就像一个流水线上的机器人 , 从诞生到退出 , 始终重复着同样的劳动——处理诸如票据、卡证等结构化的文档与数据 , 这是传统的RPA产品所能覆盖的范围 。
但在各行各业 , 都存在着大量非结构化的数据 , 例如证券行业中的合同、债权募集书等专业文档 , 这要求RPA产品不仅仅是“读”文档 , 更是“理解”文档 , 因此也就涉及到了一颗“人工智能皇冠上的明珠”——NLP(自然语言处理) 。
陈运文将NLP+OCR+RPA亲切地称为“数字员工” , 这正蕴含着他对于未来工作模式变革的期望:
结合了NLP的RPA产品 , 可以通过对语言的理解 , 不断地进行自我训练 , 强化自身的工作能力 , 这样的RPA , 更像一个员工 , 但它在记忆力、准确率、稳定性上 , 又远高于人工 。
“这将是对工作方式的变革 , 人和数字人结合的方式 , 或许是未来普遍的工作状态 。那么 , 未来的工作场景中 , 人将主要负责更高级的决策性工作 , 而细枝末节的工作交给数字员工完成 。”陈运文表示 。
既然被冠以“皇冠上的明珠”之称 , NLP在技术上自然困难非凡 。陈运文表示 , 在具体的落地场景中 , 文字语义往往变化多端 , 其中所蕴含的行业知识也十分庞杂 , 对此 , 达观数据为了让算法适应行业 , 创建了“行业知识图谱” , 帮助算法工程师基于行业理解调整优化模型参数 , “读书破万卷 , 下笔如有神” 。