哈喽 大家好
这边哈喽一下
那边哈喽一下
感觉自己好啰嗦哦
我叫Sohyla
严格意义上还不算一名软件工程师，但快了
今天要讲的内容主题是
数据挖掘
说实话，在挑选学校给的主题的时候
我一点也没有犹豫
也别问为什么
对我来说都一样
都是要从零开始查起
准备学校要求的演讲
言归正传
数据挖掘到底什么呢
数据？挖掘？脑海中是不是浮现了类似这样的画面
其实也差不多一个意思
“数据挖掘”是
从大量数据中提取
未知且可能有用的信息
接下来要讲的是
怎么将数据变为有用的信息
也就是所谓的知识
当我们从数据库里提取数据时
怎么又出现了个数据库
那是个什么鬼
好吧
让我简单且快速的说一下
什么是数据库
数据库，如其名
就是一些数据形成的表
因为有大量的数据从各种各样的网站
用不同方式提取
这导致我们收到的数据是非常乱的
所以
我们的第一步是
数据定位
这网站叫谷歌趋势（Google trends)
用这网站可以知道世界各地的朋友在网上查询什么
所以
他们是怎么利用数据挖掘来建这个网站呢？
因为他们不需要数据库里的所有数据
所以只挑选那些他们觉得对他们有用的
一些特定数据横列
我们将这个行为称之为 数据定位
举个栗子🌰
休息一下～马上继续～
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
