介绍
做这个项目的灵感,来自于我任职的上一家公司的一个OA流程的报销需求,那时候公司在大力推广自研 OA,使用 OA 流程替换以前的邮件通知(当时我们的报销流程是直接通过线上邮件的方式发送给上级,由上级统一审批之后再通过邮件往下走,在使用了 OA 流程之后,这个过程变得很简单)。 当时做这个需求的时候,需要对上传的发票进行识别(获取发票抬头、发票代码、发票号码,开票日期、消费项、总金额等)和验证(验证发票是否伪造)。
对于识别部分,我们是没有办法自己做的,所以使用了云厂商提供的 OCR 识别服务;验证部分,我们准备编写爬虫来实现,但对网站的源代码和接口进行了分析之后,发现该网站的源代码全部做了混淆(js混淆),而且还有我们常见的图片验证码。 最终这个需求里面的识别和查验全使用的云厂商提供的 API 服务。