蝴蝶效应( The Butterfly Effect)是指在一个动力系统中,初始条件下微小的变化能带动整个系统的长期的巨大的连锁反应。 先从美国麻省理工学院气象学家洛伦兹(Lorenz)的发现谈起。为了预报天气,洛伦兹(Lorenz)用计算机求解仿真地球大气的13个方程式,意图是利用计算机的高速运算来提高长期天气预报的准确性。1963年的一次试验中,为了更细致地考察结果,他把一个中间解0.506取出,提高精度到0.506127再送回。而当他到咖啡馆喝了杯咖啡以后回来再看时竟大吃一惊:本来很小的
在我们进行数据挖掘学习的过程中,除了有现成的整理好的数据集供我们使用外,我们还需要自己构建数据集。对于做文本分类的研究者来说,要做的第一步就是要将文本向量化,然后在向量空间中对文本进行研究。这样就出现了一个问题,如何将文本向量化?WVTool是一款开源软件,它主要做文本词频方面的处理,对于实现文本向量化非常有用。它支持对文本、半结构化内容(Html、XML)的向量化处理功能。并且它现在与RapidMiner Data Mining suit (YALE)可以良好的集成,因此它的应用前景还是比较