PDFlux 可高精度识别提取 PDF / 图片 / 扫描件中的表格和文本,通过特殊场景和行业文档的强化训练,模糊扫描、水印干扰、无框线表格也能精准识别,表格提取的准确率可达到 99%,尤其擅长财务报表的提取。基于深度学习技术解析文档结构,让 PDF 的内容像 Word 一样易于复制,表格行列工整,文本无乱码,大幅减少非结构化数据转化中的损耗。目前 PDFlux 提供私有化部署服务及 SaaS 私有云服务(toB),以及 PDFlux 客户端、Web 版、小程序版(toC、供客户体验为主)。
随着大数据、云计算、区块链和人工智能等前沿技术的不断迭代和适用革新,金融科技已经开始赋能传统金融产业的业务转型,借助金融科技优化现有商业模式效率、改善客户体验已成为全球商业社会的大趋势。复杂排版表格的自动分析作为人工智能的一项重要技术分支,可以实现从海量的数据文档中,提取有线框表格及复杂排版表格的功能,大大提高金融分析师的工作效率,该技术支持智能投研、智能风控等细分垂直领域场景的应用。