摘要: 本文承接 识别地图上的地名-- 笔记一 一文。非常抱歉地过了这么久了才打算把这个事情给完结了。其实很早就做完的。但是事情比较多。一直都没有写出来。二值化图像关于文字分割:如上图所示我们已经得到一个二值化的图像了。可以发现文字都是黑色的。并且文字都是在一个11*11的方格里面的。也就是说一个单独的文字最大长度和宽度都是11,例如“田” 字 。这里面的文字都比较正规。而且是统一...  阅读全文
posted @ 2009-04-04 03:36 T.t.T!Ck.¢# 阅读(1623) | 评论 (3)编辑
     摘要: 在做蜘蛛采集的时侯从一个起始地址开始能得到一大堆的URL对于内容的页面需要进行内容抽取对于URL列表的页面需要解析出内容页面URL很显然,对于不同的页面需要进行不同的操作。但是问题是,如何判断一个URL到底是内容页面还是列表页面。一个很简单的方法是:抽取页面内的所有URL,判断URL的相似度。当然通过判断页面内是否存在大块的文本也能大概知道这个页面是否内容页面。这里要提一下的是URL相似度的判断。...  阅读全文
posted @ 2008-12-16 13:55 T.t.T!Ck.¢# 阅读(600) | 评论 (9)编辑
     摘要: 在 人工神经网络(Artificial Neural Netwroks)笔记-消除样本顺序的BP算法 一文的下面提到了几个要讨论的问题 其中 “局部极小点问题,如何逃离或者避开局部极小点呢?”这个问题可以通过模拟退火算法(Simulated Annealing) 来提高逃离局部极小点向全局最优点进发的可能性。人工神经网络(Artificial Neural Netwroks)笔记-粒子群优化(Pa...  阅读全文
posted @ 2008-11-20 19:48 T.t.T!Ck.¢# 阅读(1680) | 评论 (11)编辑
     摘要: RBF 网络起源于数值分析中的多变量插值的径向基函数方法,其所具有的最佳逼近特性是传统BP 网络所不具备的。三层的RBF 网络具有可以逼近任意函数的能力。假设网络中的输入节点隐层节点输出节点数分别为N,L,M 。隐含层的作用是对输入模式进行变换将低维的模式输入数据转换到高维空间内以利于输出层进行分类识别。最常用的径向基函数是高斯核函数 ,形式为 k(||x-xc||)=exp{- ||x-xc||...  阅读全文
posted @ 2008-09-09 13:25 T.t.T!Ck.¢# 阅读(757) | 评论 (0)编辑
     摘要: 关于粒子群优化的内容可以通过搜索得到。下面主要是个人对于粒子群优化的一点理解,以及应用于BP神经网络中做权重的调整原文在:http://baike.baidu.com/view/1531379.htm引用下面一些内容===============我是引用的分界线=================粒子根据如下的公式来更新自己的速度和新的位置 v[] = w * v[] + c1 * rand() *...  阅读全文
posted @ 2008-08-28 12:17 T.t.T!Ck.¢# 阅读(1162) | 评论 (6)编辑
     摘要: 不记得是几月份了,king总接了一个私活,就是要求从地图查询的那些网站上获取到地图下来,然后识别出地图中的地名。需求很简单的目标也很明确。king总貌似用了一个星期左右的时间就完成了。在此佩服一下。在此前我已经对图像很有兴趣,但是一直没有机会练手,现在就king总上面的需求,我也来试试识别地图上的地名。大概的思路如下:把彩色的地图图像变换成灰度图像,对灰度图像进行二值化,去掉一些噪点,然后分割出单...  阅读全文
posted @ 2008-08-21 01:29 T.t.T!Ck.¢# 阅读(2112) | 评论 (18)编辑
     摘要: 在上一篇文章 《人工神经网络(Artificial Neural Netwroks)笔记-消除样本顺序的BP算法 》中 修改权重的方法被称为"最速下降法"。每一次权重的修改都是确定的,权重都会被修改。甚至到最简单的单层感知器也是如此。但是我们有一个疑问,是否每一次的权重修改都是好的呢?虽然"最速下降法"能在数学上被证明是每一次都比前一次越来越逼近最优解,但是这个逼近可是一个无休止的过程。而且面对局...  阅读全文
posted @ 2008-08-15 18:56 T.t.T!Ck.¢# 阅读(349) | 评论 (0)编辑
     摘要: 花了一个多星期的时间在重新学习 人工神经网络(Artificial Neural Netwroks)关于人工神经网络(Artificial Neural Netwroks)的介绍以及应用可以通过网络获得在我的笔记中主要关于多个算法流程是如何实现的“读书每有所得必记录之” 某人说的,因此我也诞生了下面的笔记和大家分享人工神经网络(Artificial Neural Netwroks)笔记-离散单输出...  阅读全文
posted @ 2008-07-09 18:58 T.t.T!Ck.¢# 阅读(1901) | 评论 (11)编辑
     摘要: 人工神经网络(Artificial Neural Netwroks)笔记-基本BP算法 上文中已经提到“基础BP算法“偏爱”较后出现的样本,因此较后出现的样本对网络影响较大”本文将记录如何消除这个影响用(X1,Y1),(X2,Y2),....(Xs,Ys)的总效果丢该 W^(1),W^(2),...W^(L)△W^(K)ij=∑△pW^(k)ij只是替换了原来的简单修改权重矩阵那部分具体算法流程如...  阅读全文
posted @ 2008-07-09 18:41 T.t.T!Ck.¢# 阅读(406) | 评论 (2)编辑
     摘要: 单层的感知器并不能解决XOR问题人工神经网络(Artificial Neural Netwroks)也因为这个问题而陷入了低潮,但是后来提出的多层感知器却让人工神经网络(Artificial Neural Netwroks)再一次high起来BP网络是最为广泛的一种。具体的原理介绍可以通过网络得到这里只描述算法流程基本的BP算法1 for k=1 toL do初始化W^(k)2初始化精度控制参数ε...  阅读全文
posted @ 2008-07-02 11:38 T.t.T!Ck.¢# 阅读(947) | 评论 (2)编辑
     摘要: 人工神经网络(Artificial Neural Netwroks)笔记--离散多输出感知器训练算法 中的2.1.3步是多个判断,因此我们说它是一种离散多输出感知器现在采用公式 Wij=Wij+α(Yj-Oj)Xi取代了那个步骤Yj和Oj之间的差别对Wij的影响由α(Yj-Oj)Xi表现出来这样做的好处是不仅使得算法的控制在结构上更容易理解,而且还使得它的适应面更宽算法流程如下:1.用适当的小伪随...  阅读全文
posted @ 2008-07-01 19:26 T.t.T!Ck.¢# 阅读(393) | 评论 (0)编辑
     摘要: 这是对离散单输出感知器算法的扩展相关的符号定义请参考 《人工神经网络(Artificial Neural Netwroks)笔记-离散单输出感知器算法 》OK,Start Our Game1.初始化权重矩阵W;2.重复下列过程,直到训练完成:2.1对每个样本(X,Y),重复如下过程:2.1.1 输入X;2.1.2计算O=F(XW);2.1.3 for j=1 to m do 执行如下操作:ifOj...  阅读全文
posted @ 2008-07-01 15:23 T.t.T!Ck.¢# 阅读(366) | 评论 (0)编辑
     摘要: delta规则增量学习Wij(t+1)=Wij(t)+α(Yj-Aj(t))Oi(t)式中 Wij(t+1)、Wij(t) 分别表示神经元ANi到ANj的联接在时刻t+1和时刻t的强度,Oi(t)为ANi神经元在时刻t的输出,Yj为神经元ANj的理想输出,Aj(t)为神经元ANj的激活状态,α为给定的学习率这是有监督学习(Supervised Learning)中最为重要,应用最普遍的delta规...  阅读全文
posted @ 2008-07-01 13:18 T.t.T!Ck.¢# 阅读(679) | 评论 (2)编辑
     摘要: 最近在重新学习人工神经网络(Artificial Neural Netwroks),做做笔记,整理思路离散单输出感知器算法,传说中的MP二值网络:自变量及其函数的值、向量分量的值只取0和1函数、向量权向量:W=(w1,w2,w3.....wn)输入向量:X=(x1,x2,x3.....xn)训练样本集{(X,Y)|Y为输入向量X的输出}训练过程比较简单如下:1,初始化权向量W2,重复下列过程,直到...  阅读全文
posted @ 2008-06-29 23:08 T.t.T!Ck.¢# 阅读(605) | 评论 (4)编辑
     摘要: 互信息(Mutual Information,MI)  阅读全文
posted @ 2008-06-25 11:36 T.t.T!Ck.¢# 阅读(1299) | 评论 (6)编辑
     摘要: 最近在项目中需要使用缓存来提高性能,当然是使用Memcached啦。刚找到一个不错的C#做的客户端,貌似是基于Memcached 1.2.4版本的,而刚好我问朋友要了一个1.2.4版本的服务端,完美了。咔咔主页http://code.google.com/p/beitmemcached/介绍BeIT Memcached is a client for memcached written in C#...  阅读全文
posted @ 2008-05-30 16:36 T.t.T!Ck.¢# 阅读(527) | 评论 (0)编辑
     摘要: 刚才一朋友有一个需求,就是抽取web页面列表的内容例如论坛的帖子列表,他要求通用化的简单地想了一下,思路如下:利用HtmlAgilityPack (C#) 把页面的html变成DOM树以方便操作遍历节点,计算节点之间的相似度如果节点的相似度比较高的就可以认为是相似的节点而且通过DOM树可以知道节点是否同级如果同级或者层次相同的话那么基本上就是列表里面的节点了简单思路,欢迎讨论  阅读全文
posted @ 2008-05-30 16:35 T.t.T!Ck.¢# 阅读(649) | 评论 (8)编辑
     摘要: 排名不分先后,肯定还有很多新的搜索引擎未能搜集齐全,欢迎补充。 此处主要针对新涌现的行业搜索、垂直搜索引擎。累计137家(不包括传统搜索及其分类搜索),这应该是目前最全面的整理结果。行业搜索:搜索对象针对所在的行业,采用类似传统通用搜索引擎的分词索引技术,返回关键词最匹配的结果。垂直搜索:搜索对象针对所在的行业,采用数据采集、数据挖掘、数据整理等技术,返回经过加工处理的结果。一、综合搜索酷讯www...  阅读全文
posted @ 2007-08-22 19:00 T.t.T!Ck.¢# 阅读(1903) | 评论 (8)编辑
     摘要: 目的:对于以交互式的用户界面而言,假如要调用长时间运行的操作,那么可以使用以下模式让你的调用更方便。问题:某个用户界面必须多次启动某个操作,开发人员希望将其从该接口的操作中分开。这里面可能有很多的理由,但最普遍的情形是多个操作需要被立即执行,或某个操作潜在地占用过多的时间,超过了用户所期望的等待响应时间。某写操作的完成总是要占用时间,在等待某个操作护照或者多个操作在后台执行时,用户界面应该允许用户...  阅读全文
posted @ 2007-08-04 23:09 T.t.T!Ck.¢# 阅读(2051) | 评论 (16)编辑
     摘要: 在7.9余弦定理+空间向量--我的数学3中简单地说了一下利用余弦定理来计算文本相似度。下面是利用余弦定理和广义Jaccard系数来计算文本相似度。简单介绍一下Jaccard系数:广义Jaccard系数可以用于文档数据,并在二元属性情况下归约为Jaccard系数。广义Jaccard系数又称Tanimoto系数。(有另一种系数也称为Tanimoto系数)。该系数用EJ表示,由下式定义:EJ(x,y)=...  阅读全文
posted @ 2007-08-04 13:17 T.t.T!Ck.¢# 阅读(6065) | 评论 (21)编辑
     摘要: 倒排序索引实验,无意义,无价值,纯粹为了理清思路ReverseOrderIndex.rar测试代码下载class Word 为主要被索引的词,其中 public IList<string> FileList; 该词所在的文件列表 public IList<TF> Degree;该词在对应的文件中出现的次数以及位置索引 public IList<int> Pos...  阅读全文
posted @ 2007-08-04 00:12 T.t.T!Ck.¢# 阅读(872) | 评论 (0)编辑
     摘要: 事情源于想获取某个非开源组件里面的某个资源文件的内容该资源文件为一个二进制文件,通过某种方式解析出来之后将会是一行行的字符串我就是想拿到这些字符串目的很明确开始准备工具 ildasm,ilasm,Xenocode Fox该组件已经通过Xenocode 混淆过了,但是不代表不能看,只要细心分析还是能看出端倪。通过Xenocode Fox 分析得到文件资源文件的内容通过解析之后被加载到private"...  阅读全文
posted @ 2007-07-20 02:17 T.t.T!Ck.¢# 阅读(861) | 评论 (5)编辑
     摘要: 注意:本文涉及部分数学知识,如果你有兴趣的话就继续看下去。如果没有的话,就跳到PS部分。余弦定理对我们每个人都不陌生,它描述了三角形中任何一个夹角和三个边的关系,换句话说,给定三角形的三条边,我们可以用余弦定理求出三角形各个角的角度。假定三角形的三条边为 a, b 和 c,对应的三个角为 A, B 和 C,那么角 A 的余弦 --如果我们将三角形的两边 b 和 c 看成是两个向量,那么上述公式等价...  阅读全文
posted @ 2007-07-09 19:32 T.t.T!Ck.¢# 阅读(2737) | 评论 (3)编辑
     摘要: 认真地看完了 <Google 数学之美> 系列文章 http://googlechinablog.com/,其中吴军先生在系列十八中说到:"我在大学学习线性代数时,实在想不出它除了告诉我们如何解线性方程外,还能有什么别的用途。关于矩阵的许多概念,比如特征值等等,更是脱离日常生活。后来在数值分析中又学了很多矩阵的近似算法,还是看不到可以应用的地方。当时选这些课,完全是为了混学分的学位。我...  阅读全文
posted @ 2007-07-05 13:04 T.t.T!Ck.¢# 阅读(570) | 评论 (4)编辑
     摘要: 最近几个朋友都过得不错 DAVE 去了21CN做J2ME Felix去了某香港公司做FLASH+PHP开发 live41在广州邦富做企业搜索引擎 和你去巴黎 到了深圳 为香港公司做内部系统 风行也跑去CA中国做架构师了 还有很多很多。。。 都成白领了那么我呢?何去何从。。。。。  阅读全文
posted @ 2007-07-05 13:03 T.t.T!Ck.¢# 阅读(281) | 评论 (2)编辑
     摘要: [%repeat_0 match="/data/option"%] [%=@title%][%=@count%]票 [[%=@percent%]%][%_repeat_0%] 眨眼一睇,暴汗的公式,而且下面的解析也5清5楚, 不过,最后都系做出来了 前根号为一个常量,既然是常量,只要计算出来之后就可以随便使用了 后面的 n 为加权值,需要进行人工调整变量 如此一个公式 只是 为了 计算一个词 在N...  阅读全文
posted @ 2007-07-05 13:02 T.t.T!Ck.¢# 阅读(596) | 评论 (8)编辑
     摘要: 看完数据挖掘技术在市场,营销,CRM中的应用.惊叹DM的强大的同时也着手寻找相关的服务提供商,微软,IBM,SAS 等都是这行业的老大.因为对MS的喜爱,看到SQL SERVER 2005中关于商业智能的应用,有点失望.其DM的功能只能对数值进行分析,虽然实现了贝叶斯,决策树,时序,聚类,序列聚类,关联规则等,而且连神经网络都完成了.但是却不能满足我的要求. 在分类聚类分析中还是需要我用TF.I...  阅读全文
posted @ 2007-07-05 13:01 T.t.T!Ck.¢# 阅读(333) | 评论 (2)编辑
     摘要: 原文连接:http://www.castleproject.org/container/gettingstarted/part1/index.html来自官方的一个入门教程。写了一下简单的翻译。也作为是自己学习castle的记录吧。IMHO: In My Humble Opinion 恕我直言。 这个缩写是这次翻译所学到的。^_^在这个快速入门部分,将向你介绍一些Windsor Container...  阅读全文
posted @ 2007-04-14 01:10 T.t.T!Ck.¢# 阅读(1128) | 评论 (1)编辑
     摘要: 文原文连接:http://www.c-sharpcorner.com/UploadFile/scottlysle/PlayWav01142007012501AM/PlayWav.aspx在一个win Forms应用中嵌入以及播放WAV音频文件背景本文描述如何嵌入WAV音频文件到应用程序里面以及通过使用System.Media 类库来播放这些文件。由于使用了System.Media 类库,因此在此示...  阅读全文
posted @ 2007-04-14 00:48 T.t.T!Ck.¢# 阅读(978) | 评论 (9)编辑
     摘要: 原文连接:http://www.c-sharpcorner.com/UploadFile/Joshy_geo/HexConverter10282006021521AM/HexConverter.aspx怎样将字符串转换成十六进制以及其逆转换。背景本文将告诉你怎样将字符串转换成十六进制以及其逆转换。我为我的智能卡应用而做的这个程序。较早前,我用VB写了一个但是现在我不得不将我的代码转换成C#.通常智...  阅读全文
posted @ 2007-04-14 00:36 T.t.T!Ck.¢# 阅读(7954) | 评论 (0)编辑
     摘要: 原文连接:http://www.c- sharpcorner.com/UploadFile/pk_khuman/ManagedUserDefinedFunctionUsingCSharp02212007015548AM/ManagedU serDefinedFunctionUsingCSharp.aspx用C#写托管的用户自定义 函数简介随着SQL Server 2005中集成了CLR,我们可以使...  阅读全文
posted @ 2007-04-14 00:26 T.t.T!Ck.¢# 阅读(562) | 评论 (0)编辑
     摘要: 最近买了个PDA 神达的P550感觉还不错.带GPS 带WIFI 带蓝牙很是玩了一段时间.熟识了之后做做Windows Mobile的开发.呵呵现在来说最大的好处是看电子书.每天晚上睡觉前都看半小时."互联网“信息”泛滥的时代,读书尤为重要。网上多为数据和信息,好的书中多为知识和思想,这中间的差别有如米饭和牛肉的差别,免费的米饭再多,也要不时补充些营养价值高的牛肉。"网上看到的一段话.感觉挺有道理...  阅读全文
posted @ 2007-03-24 00:48 T.t.T!Ck.¢# 阅读(400) | 评论 (6)编辑
     摘要: 原文连接http://www.c-sharpcorner.com/UploadFile/pk_khuman/ManagedTrigersUsingCSharp02202007230729PM/ManagedTrigersUsingCSharp.aspx介绍随着SQL Server 2005中集成CLR,我们可以使用现代面向对象语言例如C#,VB.NET等来建立数据库对象.本文将会用简单而必要的步骤...  阅读全文
posted @ 2007-03-22 00:05 T.t.T!Ck.¢# 阅读(804) | 评论 (0)编辑
     摘要: 原文连接:http://www.c-sharpcorner.com/UploadFile/pk_khuman/ManagedStoredProceduresUsingCSharp02182007232059PM/ManagedStoredProceduresUsingCSharp.aspx介绍随着SQL Server 2005中集成了CLR,我们可以用现代面向对象语言例如VB.NET 和C# 来建...  阅读全文
posted @ 2007-03-21 23:56 T.t.T!Ck.¢# 阅读(632) | 评论 (3)编辑
     摘要: 为了进一步提高英文水平,打算定期翻译一些技术文章.并且坚持下去.^_^已经翻译了两篇了.翻译的不怎么样,而且文章也很简单.但是作为是我跨出的第一步吧.坚持就是胜利.用C#写托管的存储过程 (翻译一) 用C#写托管触发器(翻译二)  阅读全文
posted @ 2007-03-21 23:43 T.t.T!Ck.¢# 阅读(254) | 评论 (0)编辑
     摘要: 昨晚四处搜索IBatis.Net的资料..还是博客圆这里最多.^_^ 看了福娃 IBatisNet系列二-QuickStart篇 之后 我也试着动手做一做.(没有看过福娃那文章的请先看看) Very Lucky. (February 1, 2007) The iBATIS.NET team is proud to announce that the BETA release of DataAcce...  阅读全文
posted @ 2007-02-16 20:28 T.t.T!Ck.¢# 阅读(1099) | 评论 (4)编辑
     摘要: 首要计划 :WF WSOOP JSLucene.Net ORM(具体学习哪个框架待定) 熟练存储过程 事务 触发器 其次:ASP.NET XML CSS Remoting WPF/E AOP 一些其他的.NET相关技术.一些个人兴趣的东西 : OpenCV TGE 几个比较想实现的东西 : 1.会自动学习的Lucene.Net分析器.2.基于LIBSVM的分类器.3.AIML人工智能中文机器人.打...  阅读全文
posted @ 2007-02-11 02:15 T.t.T!Ck.¢# 阅读(678) | 评论 (6)编辑
     摘要: 4:18:58从这个在线编辑器获取的时间,估计这个晚上我是不睡的了我终于想明白了某些事情.而且状态也回来.一切都可能可以按照预想的来做了.work hard more and more.  阅读全文
posted @ 2007-02-06 04:23 T.t.T!Ck.¢# 阅读(254) | 评论 (0)编辑
     摘要: 我的书桌小小地展示一下有看过一样的书的同仁来交流一下或者推荐一些其他书^_^  阅读全文
posted @ 2007-01-26 16:47 T.t.T!Ck.¢# 阅读(521) | 评论 (8)编辑
     摘要: 一忌:轻易言败,没有自信二忌:浮华不实,自满自大三忌:死气沉沉,不求甚解四忌:强调客观,忽略自身PS:网上看到的.有则改之,无则加勉  阅读全文
posted @ 2007-01-13 01:29 T.t.T!Ck.¢# 阅读(594) | 评论 (0)编辑