。
先了解半结构化或者非结构化数据,要先明白什么是结构化数据。
原有信息化建设中采用数据库图表的方式存储的数据大多数为结构化数据,也就是说,整体数据结构性很好,每条数据都有唯一标示,整体通过数据库索引进行检索,所有字段都可以通过Sql语句方便查到。这些都是结构化数据。打个比方excel就是类似一个小型的数据库,里边如果存了很多数据,方便我们查找。相对而言,word里的图表数据比excel要难查一些,PPT中如果含有图片、视频等数据,那就更加难了。那么excel就可以类比为结构化,word、PPT就可以类比半结构化和非结构化。
现在非结构化和半结构化数据量急速增长,同现在富媒体时代紧密相关,之前人们看的大多数是文字,数字;现在大家玩直播、抖音,各类视频数据增多;语音交互也更加频繁,各类物联网设备取出来的未被标准化的数据,都生成大量非结构化数据,和半结构化数据。
希望对你有所帮助。欢迎交流沟通,谢谢。
—马珂
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 xxx@163.com 举报,一经查实,本站将立刻删除。