当前的位置: 首页 >> 综合 > > 新闻详情

世界热点评!在嵊州试点的“个人全生命周期档案”综合智治应用告诉你——一生数据如何有“档”可寻

时间:2023-04-06 08:23:49 来源:杭州网

春意渐浓,又到了每年公布中小学、幼儿园招生方案的时候。最近,在嵊州,教体局正忙着统计各阶段生源数量,编制招生人数。但与多年前需要去各个幼儿园收集数据不同,如今一台电脑就能提供所有所需信息。


(资料图)

这要归功于一项关于公共数据档案化治理的改革试点。去年起,嵊州作为全省唯一试点,探索“个人全生命周期档案”综合智治应用,将贯穿个人生命周期的数据进行融合、治理、归档、溯源,让一生的数据有“档”可寻。目前,该应用已对嵊州71万户籍人口完成数据归集4114万条、数据治理808万条、场景建设5个。

3月23日,嵊州举行公共数据档案化治理研讨会,这项应用接受了来自全国的档案学者和数据治理专家的“检验”,其数据治理的阶段性成果得到专家学者肯定,下一步计划全省推广。

那么,为什么要对个人一生的数据进行档案化治理?怎么治?未来又能发挥什么效用?

一头热,一头冷

每个人的一生,其实都在产生数据。有数据专家认为,对这些数据的处理会涉及到两个问题,一是保存,即如何将纸质档案数据化,便于储存和查找;一是治理,怎么让数据归属和关联到我们每个人,让数据产生意义。

浩如烟海的档案,不仅在保存上是个难题,传播和利用也极为困难。

此时,数字化无疑成为一项重要“法宝”。2021年7月,《浙江省档案工作数字化改革方案》印发,要求加快档案资源向数字化、数据化转型。浙江在数字化改革的基础上,依托公共数据平台建立专题数据库,并依照“一数一源一标准”的原则对公共数据进行整理。

“公共数据平台就像一个水池,把与档案相关的数据放进去,经过清洗、比对和关联,建立专题数据库,相关部门需要时可以进行申请提取。”浙江省大数据发展中心主任金加和向记者介绍,目前,依托平台已归集档案相关数据536.1万条,赋能省档案馆、省司法厅等18个应用,累计调用4003.9万次。

然而,一边是档案数据化“热”,一边却是数据档案化“冷”。浙江大学公共管理学院副教授章燕华指出,目前档案实践已经普遍引入了数据理念和方法,但把档案理念引入数据实践却鲜有人关注。

“为什么数据经过了标准化的处理,还需要进行档案化治理?”嵊州的研讨会上,有人抛出了这一疑问。

章燕华用“机器友好”和“人类友好”的对比来解释其中区别,“‘一数一源一标准’治理后的数据,主要用于计算机系统内部处理。而档案化治理将和个人有关的数据进行匹配、关联,数据由此成为了一个连续体,可以按照人的一生来还原、建立其重要数据,意义重大。”

一头汇聚,一头治理

研讨会上,嵊州市档案馆、嵊州大数据中心重点讨论了项目所遇到的难点。要想实现数据档案化治理,技术上并非一蹴而就。

比如第一步原文识别就遇到大麻烦。技术人员在数据汇集时发现,很多年代久远的证明材料经常出现姓名印斜、字迹模糊等情况。这导致通过OCR技术识别出的字符和真实信息偏差很大,精准度不到60%。正当项目陷入僵局之时,嵊州大数据中心数据资源科科长徐成钢灵光一现:“不如先保证识别出最关键的信息身份证号,再把姓名、档案号等信息作为备选条件,同时通过现有身份系统进行比对核实?”

果然,分步测试后,数据识别的精准度达到95%以上。

到数据汇聚这一步,直接考验当地近年来数字化成效。徐成钢向记者展示了一张Excel统计表格,仅在“出生”这一场景,就涉及到出生医学证明、户口登记、居民身份证等8项证照的信息收集,每类信息还可能关联到不同部门。还好,省里的一体化数字资源系统(IRS)可以回流数据,将相关信息与有关业务系统进行对接,充分保证了数据的全面。

出生证新生儿身份证号如何补全?不同部门的数据产生冲突怎么办?……在第三步的数据比对、校验、加工等过程,难度持续加大。面对海量数据,这些过程都要迅速完成,构建一套智能算法是关键。于是,项目专班与负责技术研发的杭州安铂数据公司一道,构建了数据校验算法3种、数据加工算法5类,用于补全关键业务字段值,并通过身份证信息,构建个人基本信息数据专题档案。

“目前对于少量缺失或异常数据,还需要进行人工查找和核对。随着算法的不断进步,相信很快这个系统就能实现全自动化。”杭州安铂数据公司总经理王青云表示。

据悉,项目组整整用了半年时间,最终完成4114万条数据的汇聚与808万条数据的治理。嵊州市71万户籍人口基本每人实现了自己的电子化“一人一档”,随着项目推进,每个人以前、现在、今后产生的几乎所有公共数据,都可以以身份证为索引进行检索、调用,而不是以前那样分散“躺”在各种系统、表格中。

“如果将海量数据比作矿产资源,那么数据治理的过程就像金属的冶炼,通过分类分级和加工处理,将宝贵的金属材料从矿石中提取出来,满足不同用户的需求。”金加和直言,经过精细化治理的数据,才能体现数据资源的价值。

12下一页全文阅读 标签:
15037178970

公司法

更多>>

Copyright   2015-2022 法律专家网版权所有   京ICP备2022018928号-42联系邮箱:315 541 185 @ qq.com