java词频统计.doc_第1页
java词频统计.doc_第2页
java词频统计.doc_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计一篇给定的 文章中,各个单词出现的次数的算法。用HashMap 来存放出现的单词的次数,Key 是要统计的单词,Value 是单词出现的次数。最后再按照 Key 的升序排列出来。import java.util.*; import java.io.*; public class CountOccurrenceOfWords public static void main(String args) throws Exception Map hashMap = null; BufferedReader infile = null; StringTokenizer st = null; String filename = Test.txt; String string; String file = null; /打开一篇文章,名字是 Test.txt . infile = new BufferedReader(new FileReader(filename); while (string = infile.readLine() != null) file += string; /都出整篇文章,存入String中。 hashMap = new HashMap(); / 取出文章中的单词,, . ! 为各个单词的分界符。 st = new StringTokenizer(file, ,.!); while (st.hasMoreTokens() String key = st.nextToken(); if (hashMap.get(key) != null) int value = (Integer) hashMap.get(key).intValue(); value+; hashMap.put(key, new Integer(value); else hashMap.put(key, new Integer(1); /按照单词的字母次序输出。 Map treeMap = new TreeMap(hashMap); Set entrySet = treeMap.entrySet(); Iterator iterator = entrySet.iterator(); while (itera

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论