首页 综合 > 正文

科学家创造人工智能系统来识别和消除数据中的错误

我们生活在一个数据世界。我们的设备非常智能,我们的环境充满了各种开关和传感器,我们的数据正在以许多不同的方式被分析和使用。然而这些过程中并不存在人类,这些数据其实很多都是脏的。我们如何从中筛选出真正重要的东西?滑铁卢大学、威斯康星大学和斯坦福大学的科学家开发了一款名为HoloClean的工具,可以识别和删除脏数据。

脏数据本质上是各种传感器或算法收集的噪声。想象一下正在分析你的网站数据的系统。它可以访问各种信息,但并不是所有的信息都是相关的。事实上,其中一些甚至不是真实的——这是噪音,在所有电子系统中都会自然发生。HoloClean是世界上第一个基于人工智能的技术,旨在识别脏数据,并在传输前进行纠正处理。科学家表示,这个工具可能对处理大量数据的各种组织有用。

科学家指出,银行、公共事业公司和许多其他企业正在处理大量数据。不可避免的是,其中一些是不好的——可能是不准确的、错误的或根本不相关的。HoloClean可以被训练来发现错误并自行纠正。当然,训练人工智能本身是一个漫长的过程,但最终HoloClean会根据这些数据去城镇,分离错误,并加以纠正。如果这是最佳决策,或者将它们从数据池中排除。这将为用户提供用于分析的更清晰的数据集。最终目标是更容易的分析和更准确可靠的结果。

到目前为止,还需要人工识别和纠正不正确的数据。这是一个漫长而昂贵的过程,甚至也不完全准确。科学家们希望HoloClean可以加快这项工作的速度,让它变得更容易、更准确。HoloClean的开发者之一伊哈布易勒雅斯(ihab Davis)说:“这个系统解决了信息存在的问题。人们用它来运行分析,但这是不正确的。它不提供不存在的信息,而是修正你认为正确的信息”。

对准确的数据进行操作是非常重要的。只有这样,你才有希望得到准确的结果,做出有意义的决定。这是人工智能手中可能更好的工作之一。这样的系统可以被训练筛选大量的数据,识别错误并加以纠正,这个过程快速而准确。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。