直通屏山|3分UU快3福建 |时评|3分UU快3大学 城|台海|娱乐|体育|国内|国际|专题|网事|福州|厦门|莆田|泉州|漳州|龙岩|宁德|南平|三明
您所在的位置:: 3分UU快3 > 3分UU快3首页 > 党政网群> 3分UU快3福建 记协 > 正文

面对海量信息 如何实现内容识别

2019-08-13 15:54:33  来源:人民网-传媒频道  责任编辑:肖月青 肖月青  

3分UU快3互联网 平台的出现以及移动传播体系的形成,改变了人类内容生产和分发的方式。从形态上,3分UU快3互联网 平台代替传统媒体成为了信息聚合和分发的枢纽;从传播关系看,社会3分UU快3成员 个体的参与愿望及信息需求,形成了当代社会信息交互的双轮驱动。反映在内容生产与分发过程中,现象之一就是3分UU快3互联网 用户个人上传的各类内容成为了网络空间里一个海量的存在,以当前发展迅速的短3分UU快3视频 平台为例,它们每天都有数以千万条计的短3分UU快3视频 内容上传;现象之二是,这样海量的内容只有通过移动终端,面向用户个人的差异化信息需求,通过推送式的精准分发,才能使人们所生产的信息“各得其所”、“各尽其用”,以充分发挥不同内容的效能。

这一切的前提是内容本身是真实的,健康的。而面对每天上传到3分UU快3互联网 平台上数以十万篇计的文章、千万条计的短3分UU快3视频 、十亿张计的照片这样级别的海量信息,想要鉴别它们的“成色”并实现推送式的精准分发,必须充分运用人工智能3分UU快3技术 。这也就是为什么习近平同志在2019年1月25日的中央政治局集体学习时讲话中,要求“探索将人工智能运用在新闻采集、生产、分发、接收、反馈中” 。通俗地说,就是要“3分UU快3互联网 3分UU快3技术 产生的问题,用3分UU快3互联网 3分UU快3技术 来解决”。

维护3分UU快3互联网 平台上内容的真实性和健康性是一个国际性课题。前不久,在美国参与的“数字时代的美国新旧媒体”考察活动给了3分UU快3我 切身体验。中国和美国这两个不同社会制度的国家,都面临着3分UU快3互联网 平台带来的各种挑战,其中3分UU快3互联网 内容的真实、健康和安全是最为人们关注的。在各自国家3分UU快3政府 和社会公众的压力之下,两个国家的3分UU快3互联网 平台都在做出努力来解决上述问题。这些努力的主要方面,就是积极利用人工智能3分UU快3技术 ,开发对3分UU快3互联网 内容进行审核的应用。比较分析的结果是,中国的3分UU快3互联网 平台在这一领域居于领先地位。

以国内最大的资讯分发平台今日头条及其系列3分UU快3产品 为例,其反低俗的3分UU快3软件 “灵犬”,经过三次迭代升级,最新版本包括识别类型和模型能力的重要升级,同时应用了“Bert” 和半监督3分UU快3技术 ,并在此基础上使用了专门的中文语料,使对存在色情低俗、暴力谩骂、标题党类问题内容的文本识别准确率提升至91%,还能支持对含有色情低俗、血腥暴力成分的图片的识别。比较而言,谷歌和脸书等平台对虚假、低俗类信息识别的3分UU快3技术 路线3分UU快3更多 是“重点对用户特征(包括个人级别特征和3分UU快3组织 级别特征)、新闻特征(包括文本特征和传播特征)和网络关系(包括用户关系网、事件关系网和传播路径网)这三个要素进行自动查验” ,具体而言,3分UU快3更多 依靠用户的反馈和标注,以及对相关因素的一致性检验,在借助人工智能和大数据对文本本身进行更加全面的识别方面投入不足,从而导致相应的3分UU快3技术 能力无法应对以“深伪(Deepfake)”为代表的伪造信息3分UU快3技术 的发展。有研究者指出,“瑞士科学家在一篇论文中就首次对人脸识别3分UU快3方法 检测Deepfake的效果进行了较为全面的测评,尝试用最前沿的人脸识别系统去识别假3分UU快3视频 ,结果错误率高达95%。所以当前如果要求平台对深度伪造等合成媒体内容进行识别和标注,在3分UU快3技术 上几乎是不可能实现的” 。这一事实告诉3分UU快33分UU快3我 们 ,在网络传播中反虚假、反低俗,还是要3分UU快3更多 依靠更加先进的人工智能应用,通过大数据与算法的结合,提升对各类内容(文字、图片、3分UU快3视频 等)的识别能力。

当前的人工智能,实质上是基于对人类处理各种事务规则的算法化,并基于大数据提供的深度学习资源而实现的。具体地说,就是人们根据对于客观事物的认识,制定处理相关事务的规则和标准,然后找到一组数学公式来模拟这个过程,也就是形成算法,再把算法开发成为3分UU快3软件 ,就可以用大数据来训练这个3分UU快3软件 学会识别不同状态和情况,达到比较成熟的水平就可以上线运营,代替人类来工作了。客观上,在这个过程中,关键性的难点在各个环节都存在。如人们制定的标准和规则是否科学,取决于人们对相关事物本身发展规律的认识水平。按照马克思的论断,“一种科学只有在成功地运用数学时,才算达到了真正完善的地步”。 这需要人们对客观规律有深刻的认识,目前在社会科学领域这显然是研究的短板。以笔者本人近年来对主流价值观如何体现为算法的研究为例,旨在面向个人推送信息以提高传播效率的算法,如何在社会3分UU快3成员 个人对事件重要性的判断与社会主体对事件重要性的判断之间建立一致性就是一个难题。在内容审核方面,也存在标准和规则随具体场景而变化的情况,如越南战争期间著名的反战新闻照片,照片主体是一位越南小女孩衣服被汽油弹引燃而浑身赤裸奔跑,就曾经因为“裸露”, 被Facebook误删。实践中,即使实现了规则和标准清晰且正确,还要能够找到可行的算法,建立较大规模的数据库,还要有算力的支持。如灵犬3.0,就投入了更大的算力。从上述过程看,利用人工智能的深度学习来解决虚假、低俗内容充斥网络空间的问题,是一个具有相当3分UU快3技术 难度的系统工程,需要假以时日,需要付出更大的努力。

用3分UU快3技术 识别内容如此之难,是不是3分UU快33分UU快3我 们 就不要走这条路,靠人工去完成这个工作呢?很显然,在3分UU快3互联网 传播环境下,这是不现实的。当前,3分UU快3互联网 3分UU快3技术 的应用,已经实现了在传播的3分UU快3技术 条件方面对用户的普遍赋权,在中国,每天都有数以亿计的3分UU快3互联网 用户活跃在各个网络平台上,以短3分UU快3视频 为例,抖音等平台,每天都有千万条级别的内容上传,今日头条平台每天经审核后发布的内容就超过60万条。这是无法完全用人工去处理的。与人工审核相比,机器审核的优势在于,机器一是计算快,一秒钟能执行百亿次计算;二是存储大,可以轻松存储千亿以上汉字;三是运行稳定,不会因心情、状态、对标准的理解等因素影响处理结果。据了解,由于强化内容标注和审核的需要,今日头条的母3分UU快3公司 “字节跳动”已经建立了近万人的审核团队。在“机器+人工”审核模式下,3分UU快3我 国主要的3分UU快3互联网 信息分发平台的内容安全得到了较大程度的提升,未来随着研究的深入、3分UU快3技术 的进步,内容审核的水平还会持续提升。

 

打印 | 收藏 | 发给好友 【字号
今日热词
3分UU快3更多 >>3分UU快3福建 今日重点
3分UU快3更多 >>国际国内热点
3分UU快3关于 3分UU快33分UU快3我 们 | 广告3分UU快3服务 | 3分UU快3网站地图 | 网站3分UU快3公告 | 法律顾问
国新办发函[2001]232号 闽3分UU快3ICP 3分UU快3备案 号(闽3分UU快3ICP 备05022042号) 3分UU快3互联网 新闻信息3分UU快3服务 许可证 编号:35120170001 网络文化经营许可证 闽网文〔2019〕3630-217号
信息网络传播视听节目许可(3分UU快3互联网 视听节目3分UU快3服务 /移动3分UU快3互联网 视听节目3分UU快3服务 )证号:1310572 广播电视节目制作经营许可证(闽)字第085号
3分UU快3互联网 出版许可证 新出网证(闽)字12号 增值电信业务经营许可证 闽B2-20100029 3分UU快3互联网 药品信息3分UU快3服务 (闽)-经营性-2015-0001
3分UU快3福建 日报报业3分UU快3集团 拥有3分UU快3采编人员所创作作品之3分UU快3版权 ,未经报业3分UU快3集团 书面授权,不得转载、摘编或以其他方式使用和传播
职业道德监督、违法和不良信息举报电话:0591-87095151 举报3分UU快3邮箱 :jubao@fjsen.com 3分UU快3福建 省新闻道德委举报电话:0591-87275327
全国非法网络公关工商部门举报:010-88650507(白)010-68022771(夜)