求教大段文字提取所需信息的方案

我们有这个一个需求:
有个表单,本来是需要一个字段一个字段去填的,现在需求是把所有信息通过语音识别的方式,填充到一个 textarea 中,然后代码解析去 填充

就类似于 顺丰 填 地址那样,

目前 语音识别文字已经完成,但是对于如何从 大段文字中 准确的提取出自己表单所需的信息,就想问一下有没有什么好的工具,比如 jar 包,js 插件之类的。自己定义规则然后 代码提取的。

另外,这种是直接在小程序去处理还是 后台处理比较好呢?