



全文预览已结束
下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
package fileAndStringOperate;import java.io.BufferedReader;import java.io.File;import java.io.FileOutputStream;import java.io.FileReader;import java.io.FileWriter;import java.io.IOException;import java.io.OutputStream;public class ReadFileToString public static void main(String args) throws IOExceptionString fileData = readtxt(D:IR1JAVA网络爬虫.txt);CountRelatedDocument(fileData);/MyWebRec myWebRec = new MyWebRec2000;ClassifyURL(fileData);private static String readtxt(String filePath) throws IOExceptionBufferedReader br=new BufferedReader(new FileReader(filePath);String str=;String r=br.readLine();while(r!=null)str+=r+n;r=br.readLine();return str;private static char readtxtToChar(String filePath) throws IOExceptionchar data = null;int currentline = 0;BufferedReader br=new BufferedReader(new FileReader(filePath);String str=;String r=br.readLine();while(r!=null)str+=r+n;datacurrentline+ = str.toCharArray();r=br.readLine();return data;private static int CountRelatedDocument(String fileData)int cntRelated = 0;int currentLine = 1;int baiduCnt = 0;int bingCnt = 0;int sogouCnt = 0;int _360Cnt = 0;int State = 0;boolean baiduY = new boolean51;boolean bingY = new boolean51;boolean sogouY = new boolean51;boolean _360Y = new boolean51;char fileChar = fileData.toCharArray();for(int i = 0; i fileChar.length;i +)if(fileChari = # & fileChari+1 = *)State+;System.out.println(分点:+currentLine);if(fileChari = n)currentLine +;if(currentLine %3 = 0)if(fileChari = Y|fileChari = y)if(State = 1)baiduCnt +;baiduYcurrentLine/3 = true;else if(State = 2)bingCnt +;bingYcurrentLine/3 - 50 = true;/System.out.println(currentLine/3 - 50);else if(State = 3)sogouCnt +;sogouYcurrentLine/3 - 100 =true;else if(State = 4)_360Cnt +;_360YcurrentLine/3 - 150 = true;cntRelated+;tryCaculatePR(baiduY,bingY,_360Y,sogouY,cntRelated);catch(Exception e)e.getMessage();System.out.println(cntRelated = +cntRelated);System.out.println(baiduCnt = +baiduCnt);System.out.println(bingCnt = +bingCnt);System.out.println(sohuCnt = +sogouCnt);System.out.println(_360Cnt = +_360Cnt);System.out.println(currentLine = + currentLine);return cntRelated;private static void ClassifyURL(String fileData)String str1 = fileData.split(n);for(int i = 0;i str1.length;i +)if(str1i.startsWith(#*)str1i = str1i.substring(10);private static void CaculatePR(boolean baiduY,boolean bingY,boolean _360Y,boolean sogouY,int cntRelated) throws IOExceptiondouble baiduP = new double 51;double baiduR = new double 51;double bingP = new double 51;double bingR = new double 51;double sogouP = new double 51;double sogouR = new double 51;double _360P = new double 51;double _360R = new double 51;int cntBaidu = 0;int cntBing = 0;int cntSogou = 0;int cnt360 = 0;/System.out.println(Related:+cntRelated);for(int i = 1;i = 50;i +)if(baiduYi = true)cntBaidu +;if(bingYi = true)cntBing +;if(sogouYi = true)cntSogou +;if(_360Yi = true)cnt360 +;baiduPi = 1.000000*cntBaidu/i;baiduRi = 1.000000*cntBaidu/cntRelated;bingPi = 1.000000*cntBing/i;bingRi = 1.000000*cntBing/cntRelated;sogouPi = 1.000000*cntSogou/i;sogouRi = 1.000000*cntSogou/cntRelated;_360Pi = 1.000000*cnt360/i;_360Ri = 1.000000*cnt360/cntRelated;/System.out.print(cntBaidu+t+cntBing+t+cntSogou+t+cnt360+n);CaculateMAP(baiduP,bingP,sogouP, _360P);File file = new File(D:/JAVA网络爬虫.txt);FileWriter out = new FileWriter(file); /文件写入流 /将数组中的数据写入到文件中。每行各数据之间TAB间隔 for(int i=1;i=50;i+) out.write(baidu+t+baiduPi+t + baiduRi+rn); for(int i=1;i=50;i+) out.write(bing+t+bingPi+t + bingRi+rn); for(int i=1;i=50;i+) out.write(sogou+t+sogouPi+t + sogouRi+rn); for(int i=1;i=50;i+) out.write(360+t+_360Pi+t + _360Ri+rn); out.close();private static void CaculateMAP(double baiduP,double bingP,double sogouP,double _360P)double baiduPre=0,bingPre=0,sogouPre=0,_360Pre=0;for(int i = 1;i = 50;i + )baiduPre += ba
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 汽车智能外饰生产线项目建筑工程方案
- 粉煤灰处置及综合利用项目风险评估报告
- 城市更新中的水资源管理与节约策略
- 六年级上册心理健康教育教案- 7在合作中成长 | 辽大版
- 4.2细菌 说课稿2023-2024学年人教版生物八年级上册
- 2024-2025学年学年高三地理《地表形态的塑造》说课稿
- 高纯氟化铝生产线项目施工方案
- 第一节 电阻定律说课稿-2025-2026学年中职基础课-化工农医类-高教版(2021)-(物理)-55
- Unit 2 Different families PA Let's learn (教学设计)-人教PEP版(2024)英语三年级上册
- Module 2 What can you do Unit 3 Language in use教学设计-2023-2024学年外研版英语七年级下册
- 河南天一大联考2025-2026学年(上)高一上学期9月检测语文试卷
- 养好小金鱼教学课件
- 2025年度社区工作者真题题库及答案
- 23G409先张法预应力混凝土管桩
- 物理课件电源和电流
- 《无人机载荷与行业应用》教学课件合集
- 《西安交通大学》课件
- 搜索引擎营销案例分析
- 华信惠悦GGS全球职等系统
- 肝血管瘤患者的护理查房
- 吉塔行星模拟课程
评论
0/150
提交评论