java 解析 json

本贴最后更新于 2928 天前,其中的信息可能已经沧海桑田

我解析 json 用的是

1461122367666

解析的是如下数据类型:

1461122480573

现在问题是,msg_ID,msg_type 那两种我看网上说的都是匹配 mail 的正则。

如果用我的 JSONUtil 解析以后,上面两种正则解析出如下格式:

1461122813213

红色框中的\全部没有了,绿色的那种是由原来的 双\ 解析成\。而在用的时候,肯定绿色框中的是正则形式。

那只需要在解析前将\全部换成 双\ 就可以了吗,不会有其他的问题吗?(其实做那个文件时候也可以遇到\就写成 双\ ,不过估计客户不干。。。)

另外,只有这个符号会出这种问题吗?其他有没有符号比较特殊呢? 这也不能每个符号都去测试一次吧?

你们有解析 json 格式的数据,里面 value 值是正则表达式的情况吗?如果有,那怎么解决的呢?

(刚才预览发现如果我在文中写两个\,组合的形式,预览的时候,只显示一个\,于是将原来写两个\的地方改成了 双\)。

打赏 10 积分后可见
10 积分 • 4 打赏
  • JSON

    JSON (JavaScript Object Notation)是一种轻量级的数据交换格式。易于人类阅读和编写。同时也易于机器解析和生成。

    51 引用 • 190 回帖
  • 正则表达式

    正则表达式(Regular Expression)使用单个字符串来描述、匹配一系列遵循某个句法规则的字符串。

    31 引用 • 94 回帖
  • Java

    Java 是一种可以撰写跨平台应用软件的面向对象的程序设计语言,是由 Sun Microsystems 公司于 1995 年 5 月推出的。Java 技术具有卓越的通用性、高效性、平台移植性和安全性。

    3168 引用 • 8207 回帖

相关帖子

24 回帖

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • qzzsunly 1

    因为反斜杠在 java 中需要转义的啊

  • yangyujiao
    作者

    @qzzsunly 那就是只有这一个符号会有问题吗? 就这一个好解决 我可以再解析前转一下,抗不住,有很多类似的特殊字符呀。。。

  • qzzsunly

    @yangyujiao 比如还有啥特殊字符

  • yangyujiao
    作者

    @qzzsunly 这我刚随便在网上看了一个。

    1461123766671

    但是其实没咋看明白,况且这难道就是全部?

  • hei

    这不是全部,网上 有解决处理正则特殊符号的例子

  • yangyujiao
    作者

    @hei 我就在找,但是没有找到。很多都是说用正则去解析 json 的。没有找到 json 中是个正则表达式的怎么去解析。

  • yangyujiao
    作者

    @participants
    这种是正则:

    1461124107458

    这种是不是呢,就是把里面的单\ 变成了双\

    1461124138535

    上面两张截图我参考的位置:http://www.cnblogs.com/light169/archive/2006/10/18/532347.html

  • 714593351

    赞饺子!

  • 714593351

    顶饺子!

  • zempty

    辛苦了,写得很好。

  • yangyujiao
    作者

    @zempty 谢谢捧场 👏

  • 大有收获!!!!打赏值!

  • 不知道 fastjson 会怎么样~~~

  • yangyujiao
    作者

    @Hassan 我没有用这个解压过,不知道,你如果有这个包,可以试试,把结果告知一下。

  • 人生苦短,我用 Python

  • Angonger

    \\

  • Angonger

    "\\"

  • @yangyujiao

    我试了一下,fastjson,解析第一个直接报错;解析第二个双\解析成\。

    我顺带看了一下 json 格式的标准,其中字符串值的格式要求是:
    1461204658987
    A string is a sequence of zero or more Unicode characters, wrapped in double quotes, using backslash escapes. A character is represented as a single character string. A string is very much like a C or Java string.

    所以理论上说 JSONUtil 解析第一个直接把\去掉并不合理,应该抛异常才对,因为第一个根本就是错误的 json 格式!第二个双\解析成\是合理的!

  • 所以,问题不在你需要转义的问题,而是产生这个数据源的程序的问题~

  • 转义的时候,应该检查 json 格式,不满足 json 格式就直接抛异常了。不应该继续解析。

  • yangyujiao
    作者

    @Hassan 我现在的解决办法就是,因为我是读取那个有正则的 json 文件,让写这个文件的人,如果用了特殊的字符就加\转义,我程序不做处理了。这样合理吗?

    “不满足json格式就直接抛异常了”
    

    好像真的是你说的这样,这明明就不符合 json 格式的,但是我用的那个类根本就没有抛出异常。我在 json 验证中是会出错的:

    1461205488348

    那是不是我可以用我的那个解决办法,就是程序不做任何处理,就是 json 文件里面处理。

  • @yangyujiao 对,程序不应该继续处理格式不对的 json 字符串,应该抛异常才合理。处理 json 文件才对。(应该处理产生 json 文件的程序,这是职责问题)

  • yangyujiao
    作者

    @Hassan 谢谢啦,么么哒

  • zonghua

    @Hassan Python 总是解码成 unicode 也是烦

请输入回帖内容 ...

推荐标签 标签

  • AngularJS

    AngularJS 诞生于 2009 年,由 Misko Hevery 等人创建,后为 Google 所收购。是一款优秀的前端 JS 框架,已经被用于 Google 的多款产品当中。AngularJS 有着诸多特性,最为核心的是:MVC、模块化、自动化双向数据绑定、语义化标签、依赖注入等。2.0 版本后已经改名为 Angular。

    12 引用 • 50 回帖 • 423 关注
  • V2EX

    V2EX 是创意工作者们的社区。这里目前汇聚了超过 400,000 名主要来自互联网行业、游戏行业和媒体行业的创意工作者。V2EX 希望能够成为创意工作者们的生活和事业的一部分。

    17 引用 • 236 回帖 • 418 关注
  • OAuth

    OAuth 协议为用户资源的授权提供了一个安全的、开放而又简易的标准。与以往的授权方式不同之处是 oAuth 的授权不会使第三方触及到用户的帐号信息(如用户名与密码),即第三方无需使用用户的用户名与密码就可以申请获得该用户资源的授权,因此 oAuth 是安全的。oAuth 是 Open Authorization 的简写。

    36 引用 • 103 回帖 • 9 关注
  • JWT

    JWT(JSON Web Token)是一种用于双方之间传递信息的简洁的、安全的表述性声明规范。JWT 作为一个开放的标准(RFC 7519),定义了一种简洁的,自包含的方法用于通信双方之间以 JSON 的形式安全的传递信息。

    20 引用 • 15 回帖 • 20 关注
  • FlowUs

    FlowUs.息流 个人及团队的新一代生产力工具。

    让复杂的信息管理更轻松、自由、充满创意。

    1 引用
  • JVM

    JVM(Java Virtual Machine)Java 虚拟机是一个微型操作系统,有自己的硬件构架体系,还有相应的指令系统。能够识别 Java 独特的 .class 文件(字节码),能够将这些文件中的信息读取出来,使得 Java 程序只需要生成 Java 虚拟机上的字节码后就能在不同操作系统平台上进行运行。

    180 引用 • 120 回帖 • 2 关注
  • 微信

    腾讯公司 2011 年 1 月 21 日推出的一款手机通讯软件。用户可以通过摇一摇、搜索号码、扫描二维码等添加好友和关注公众平台,同时可以将自己看到的精彩内容分享到微信朋友圈。

    129 引用 • 793 回帖
  • JRebel

    JRebel 是一款 Java 虚拟机插件,它使得 Java 程序员能在不进行重部署的情况下,即时看到代码的改变对一个应用程序带来的影响。

    26 引用 • 78 回帖 • 623 关注
  • Vim

    Vim 是类 UNIX 系统文本编辑器 Vi 的加强版本,加入了更多特性来帮助编辑源代码。Vim 的部分增强功能包括文件比较(vimdiff)、语法高亮、全面的帮助系统、本地脚本(Vimscript)和便于选择的可视化模式。

    27 引用 • 66 回帖
  • SOHO

    为成为自由职业者在家办公而努力吧!

    7 引用 • 55 回帖 • 92 关注
  • Log4j

    Log4j 是 Apache 开源的一款使用广泛的 Java 日志组件。

    20 引用 • 18 回帖 • 41 关注
  • 旅游

    希望你我能在旅途中找到人生的下一站。

    85 引用 • 895 回帖 • 1 关注
  • SQLServer

    SQL Server 是由 [微软] 开发和推广的关系数据库管理系统(DBMS),它最初是由 微软、Sybase 和 Ashton-Tate 三家公司共同开发的,并于 1988 年推出了第一个 OS/2 版本。

    19 引用 • 31 回帖 • 2 关注
  • B3log

    B3log 是一个开源组织,名字来源于“Bulletin Board Blog”缩写,目标是将独立博客与论坛结合,形成一种新的网络社区体验,详细请看 B3log 构思。目前 B3log 已经开源了多款产品:SymSoloVditor思源笔记

    1083 引用 • 3461 回帖 • 286 关注
  • Vditor

    Vditor 是一款浏览器端的 Markdown 编辑器,支持所见即所得、即时渲染(类似 Typora)和分屏预览模式。它使用 TypeScript 实现,支持原生 JavaScript、Vue、React 和 Angular。

    313 引用 • 1667 回帖 • 1 关注
  • OnlyOffice
    4 引用 • 23 关注
  • 尊园地产

    昆明尊园房地产经纪有限公司,即:Kunming Zunyuan Property Agency Company Limited(简称“尊园地产”)于 2007 年 6 月开始筹备,2007 年 8 月 18 日正式成立,注册资本 200 万元,公司性质为股份经纪有限公司,主营业务为:代租、代售、代办产权过户、办理银行按揭、担保、抵押、评估等。

    1 引用 • 22 回帖 • 684 关注
  • Scala

    Scala 是一门多范式的编程语言,集成面向对象编程和函数式编程的各种特性。

    13 引用 • 11 回帖 • 108 关注
  • 链书

    链书(Chainbook)是 B3log 开源社区提供的区块链纸质书交易平台,通过 B3T 实现共享激励与价值链。可将你的闲置书籍上架到链书,我们共同构建这个全新的交易平台,让闲置书籍继续发挥它的价值。

    链书社

    链书目前已经下线,也许以后还有计划重制上线。

    14 引用 • 257 回帖 • 2 关注
  • Android

    Android 是一种以 Linux 为基础的开放源码操作系统,主要使用于便携设备。2005 年由 Google 收购注资,并拉拢多家制造商组成开放手机联盟开发改良,逐渐扩展到到平板电脑及其他领域上。

    333 引用 • 323 回帖 • 65 关注
  • sts
    2 引用 • 2 回帖 • 148 关注
  • 爬虫

    网络爬虫(Spider、Crawler),是一种按照一定的规则,自动地抓取万维网信息的程序。

    106 引用 • 275 回帖 • 2 关注
  • RIP

    愿逝者安息!

    8 引用 • 92 回帖 • 290 关注
  • RabbitMQ

    RabbitMQ 是一个开源的 AMQP 实现,服务器端用 Erlang 语言编写,支持多种语言客户端,如:Python、Ruby、.NET、Java、C、PHP、ActionScript 等。用于在分布式系统中存储转发消息,在易用性、扩展性、高可用性等方面表现不俗。

    49 引用 • 60 回帖 • 399 关注
  • golang

    Go 语言是 Google 推出的一种全新的编程语言,可以在不损失应用程序性能的情况下降低代码的复杂性。谷歌首席软件工程师罗布派克(Rob Pike)说:我们之所以开发 Go,是因为过去 10 多年间软件开发的难度令人沮丧。Go 是谷歌 2009 发布的第二款编程语言。

    492 引用 • 1383 回帖 • 375 关注
  • 百度

    百度(Nasdaq:BIDU)是全球最大的中文搜索引擎、最大的中文网站。2000 年 1 月由李彦宏创立于北京中关村,致力于向人们提供“简单,可依赖”的信息获取方式。“百度”二字源于中国宋朝词人辛弃疾的《青玉案·元夕》词句“众里寻他千百度”,象征着百度对中文信息检索技术的执著追求。

    63 引用 • 785 回帖 • 251 关注
  • WebSocket

    WebSocket 是 HTML5 中定义的一种新协议,它实现了浏览器与服务器之间的全双工通信(full-duplex)。

    48 引用 • 206 回帖 • 398 关注