分享到:

fdupes:Linux中查找并删除重复文件的命令行工具

对于大多数计算机用户而言,查找并替换重复的文件是一个常见的需求。查找并移除重复文件真是一项令人不胜其烦的工作,它耗时又耗力。但如果你的机器上跑着GNU/Linux,那么查找重复文件会变得十分简单,这多亏了fdupes工具。 fdupes——在Linux中查找并删除重复文件   fd

收藏 评论(0) 2016-09-12数据采集

solr找到与查询结果相似的文档

找到与查询结果相似的文档: http://localhost:8983/solr/select?q=name:edition&mlt=true&mlt.fl=name&mlt.mintf=1&mlt.mindf=1 mlt.fl:按照结果文档的哪一个field求相似。 mlt.

收藏 评论(0) 2016-08-30数据采集

Solr:Schema设计

本文已挪至  http://www.zhoujingen.cn/blog/8546.html   Solr将数据以结构化的方式存入系统中,存储的过程中可以对数据建立索引,这个结构的定义就是通过schema.xml来配置的。 xml version="1.0" encoding="UTF-8

收藏 评论(0) 2016-08-24数据采集

Tomcat/Solr4

记录下solr在tomcat下的配置:首先要保证tomcat环境是正常的,已自己的环境为例: 1:下载最新版的 solr-4.3.1.zip 解压 ,将solr-4.3.1distsolr-4.3.1.war文件复制到tomcat的webapps目录下,并将

收藏 评论(0) 2016-08-24数据采集

linux 如何显示一个文件的某几行(中间几行)

【一】从第3000行开始,显示1000行。即显示3000~3999行cat filename | tail -n +3000 | head -n 1000 【二】显示1000行到3000行cat filename| head -n 3000 | tail -n +1000 *注意

收藏 评论(0) 2016-08-18数据采集

mysql实例cpu超过100%分析

mysql实例cpu超过100%分析当我们mysql数据库实例超过100%时,这种情况都是因sql性能问题导致,实例出现卡主现象:1.原理,cpu消耗过大有慢sql造成,慢sql包括全表扫描,扫描数据量太大,内存排序,磁盘排序,锁争用等;2.表的现象sql执行状态为:send

收藏 评论(0) 2016-08-17数据采集

linux下的split 命令(将一个大文件根据行数平均分成若干个小文件)

将一个大文件分成若干个小文件方法 例如将一个BLM.txt文件分成前缀为 BLM_ 的1000个小文件,后缀为系数形式,且后缀为4位数字形式 先利用 wc -l BLM.txt       读出 BLM.txt 文件一共有多少行 再利用 split

收藏 评论(0) 2016-08-15数据采集

【MySQL】事务没有提交导致 锁等待Lock wait timeout exceeded异常

异常:Lock wait timeout exceeded; try restarting transaction解决办法:执行select * from information_schema.innodb_trx 之后找到了一个一直没有提交的只读事务, 找到对应的线程后,执行 kill thread id,

收藏 评论(0) 2016-08-10数据采集

手把手教你开发Chrome扩展三:关于本地存储数据

手把手教你开发chrome扩展一:开发Chrome Extenstion其实很简单 手把手教你开发Chrome扩展二:为html添加行为 手把手教你开发Chrome扩展三:关于本地存储数据 HTML5中的localStorage localStorage与cookie类似,它是存储在客户端浏览器中的数据,它与c

收藏 评论(0) 2013-05-28数据采集

手把手教你开发Chrome扩展二:为html添加行为

手把手教你开发chrome扩展一:开发Chrome Extenstion其实很简单 手把手教你开发Chrome扩展二:为html添加行为 手把手教你开发Chrome扩展三:关于本地存储数据 上一节我们已经讲了Chrome扩展的基础知识,并构建了基础的html,这一节我们将就html DOM添加部分添加脚本,即脚本

收藏 评论(0) 2013-05-28数据采集