



全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
package fileAndStringOperate;import java.io.BufferedReader;import java.io.File;import java.io.FileOutputStream;import java.io.FileReader;import java.io.FileWriter;import java.io.IOException;import java.io.OutputStream;public class ReadFileToString public static void main(String args) throws IOExceptionString fileData = readtxt(D:IR1JAVA网络爬虫.txt);CountRelatedDocument(fileData);/MyWebRec myWebRec = new MyWebRec2000;ClassifyURL(fileData);private static String readtxt(String filePath) throws IOExceptionBufferedReader br=new BufferedReader(new FileReader(filePath);String str=;String r=br.readLine();while(r!=null)str+=r+n;r=br.readLine();return str;private static char readtxtToChar(String filePath) throws IOExceptionchar data = null;int currentline = 0;BufferedReader br=new BufferedReader(new FileReader(filePath);String str=;String r=br.readLine();while(r!=null)str+=r+n;datacurrentline+ = str.toCharArray();r=br.readLine();return data;private static int CountRelatedDocument(String fileData)int cntRelated = 0;int currentLine = 1;int baiduCnt = 0;int bingCnt = 0;int sogouCnt = 0;int _360Cnt = 0;int State = 0;boolean baiduY = new boolean51;boolean bingY = new boolean51;boolean sogouY = new boolean51;boolean _360Y = new boolean51;char fileChar = fileData.toCharArray();for(int i = 0; i fileChar.length;i +)if(fileChari = # & fileChari+1 = *)State+;System.out.println(分点:+currentLine);if(fileChari = n)currentLine +;if(currentLine %3 = 0)if(fileChari = Y|fileChari = y)if(State = 1)baiduCnt +;baiduYcurrentLine/3 = true;else if(State = 2)bingCnt +;bingYcurrentLine/3 - 50 = true;/System.out.println(currentLine/3 - 50);else if(State = 3)sogouCnt +;sogouYcurrentLine/3 - 100 =true;else if(State = 4)_360Cnt +;_360YcurrentLine/3 - 150 = true;cntRelated+;tryCaculatePR(baiduY,bingY,_360Y,sogouY,cntRelated);catch(Exception e)e.getMessage();System.out.println(cntRelated = +cntRelated);System.out.println(baiduCnt = +baiduCnt);System.out.println(bingCnt = +bingCnt);System.out.println(sohuCnt = +sogouCnt);System.out.println(_360Cnt = +_360Cnt);System.out.println(currentLine = + currentLine);return cntRelated;private static void ClassifyURL(String fileData)String str1 = fileData.split(n);for(int i = 0;i str1.length;i +)if(str1i.startsWith(#*)str1i = str1i.substring(10);private static void CaculatePR(boolean baiduY,boolean bingY,boolean _360Y,boolean sogouY,int cntRelated) throws IOExceptiondouble baiduP = new double 51;double baiduR = new double 51;double bingP = new double 51;double bingR = new double 51;double sogouP = new double 51;double sogouR = new double 51;double _360P = new double 51;double _360R = new double 51;int cntBaidu = 0;int cntBing = 0;int cntSogou = 0;int cnt360 = 0;/System.out.println(Related:+cntRelated);for(int i = 1;i = 50;i +)if(baiduYi = true)cntBaidu +;if(bingYi = true)cntBing +;if(sogouYi = true)cntSogou +;if(_360Yi = true)cnt360 +;baiduPi = 1.000000*cntBaidu/i;baiduRi = 1.000000*cntBaidu/cntRelated;bingPi = 1.000000*cntBing/i;bingRi = 1.000000*cntBing/cntRelated;sogouPi = 1.000000*cntSogou/i;sogouRi = 1.000000*cntSogou/cntRelated;_360Pi = 1.000000*cnt360/i;_360Ri = 1.000000*cnt360/cntRelated;/System.out.print(cntBaidu+t+cntBing+t+cntSogou+t+cnt360+n);CaculateMAP(baiduP,bingP,sogouP, _360P);File file = new File(D:/JAVA网络爬虫.txt);FileWriter out = new FileWriter(file); /文件写入流 /将数组中的数据写入到文件中。每行各数据之间TAB间隔 for(int i=1;i=50;i+) out.write(baidu+t+baiduPi+t + baiduRi+rn); for(int i=1;i=50;i+) out.write(bing+t+bingPi+t + bingRi+rn); for(int i=1;i=50;i+) out.write(sogou+t+sogouPi+t + sogouRi+rn); for(int i=1;i=50;i+) out.write(360+t+_360Pi+t + _360Ri+rn); out.close();private static void CaculateMAP(double baiduP,double bingP,double sogouP,double _360P)double baiduPre=0,bingPre=0,sogouPre=0,_360Pre=0;for(int i = 1;i = 50;i + )baiduPre += ba
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 幼儿园纺织设备管理制度
- 幼儿园采购制度管理制度
- 幼儿看护点财务管理制度
- 店铺运营公司日常管理制度
- 徐水区医院疫情管理制度
- 怎样强化皮带设备管理制度
- 手工绘画实训室管理制度
- 护士长教育培训管理制度
- 拓展性课程班级管理制度
- 文创公司办公日常管理制度
- 上海浦东新区公办学校储备教师教辅招聘笔试真题2024
- 2025年中国水性马克笔行业市场前景预测及投资价值评估分析报告
- 电动汽车充换电站建设资料标准
- JG/T 375-2012金属屋面丙烯酸高弹防水涂料
- 南邮综评面试题目及答案
- 23G409先张法预应力混凝土管桩
- DL∕T 1498.2-2016 变电设备在线监测装置技术规范 第2部分:变压器油中溶解气体在线监测装置
- SCH系列钢管通径壁厚对照公制版
- 18无财产无债务1个子女——离婚协议书范本模版
- 202X—202X学年第二学期教学工作总结
- 电缆沟施工方案
评论
0/150
提交评论