Category - Machine Learning

2016-05-16 17:59:17    212    0    0
通过一个例子来学习: 现在有三种鸢尾花: - Iris Setosa - Iris Versicolor - Iris Virginica ![](https://leanote.com/api/file/getImage?fileId=57399a0bab64413fd7011195) 我们想要通过四种特征来分辨他们,这四种特征分别是: - sepal length(花萼)
2016-05-09 23:22:49    221    0    0

文本特征提取技术


 

 

分词

  • 分词实例:

    • 和平民主

      • 和平, 民主

      • 和,平民,主

  • 提高人民生活水平

    • 提高,高人,人民,民生,生活,活水,水平

  • 大学生活像白纸

    • 大学,生活,像,白纸

    • 大学生,活像,白纸

分词基本方法

  • 最大匹配法

  • 最大概率法分词

  • 最短路径分词法

  • 难点:

2016-05-09 23:17:19    232    0    0

数据挖掘的概念

  • 关于文本挖掘的名字

    • ™ Text Mining,

    •  Text Data Mining,

    • ™ Knowledge Discovery in Text,

    •  Knowledge Discovery in Textual Data(bases)

  • Text mining mainly is about somehow extracting t

2016-04-15 09:10:59    40    0    0
# 定义 SVM,即支持向量机, # 求解思路 - 简单情况,线性可分,把问题转化为一个凸优化问题,可以用拉格朗日乘子法简化, 然后用既有的算法解决 - 复杂情况,线性可分,用映射函数将样本投射到高维空间,使其变成线性可分的情 形。利用核函数来减少高维度计算量 # 线性可分的情形(决策边界) ![](https://leanote.com/api/file/getImage?fil
2016-04-15 09:10:59    356    0    0
安装: ``` # Ubuntu/Linux 64-bit, CPU only: $ sudo pip install --upgrade https://storage.googleapis.com/tensorflow/linux/cpu/tensorflow-0.8.0rc0-cp27-none-linux_x86_64.whl ``` 测试安装: ``` In [1]: import t