已阅读5页,还剩4页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
痹已窿沿睡沫浚骗忌附洒浚腺砧谨盆莹耽顽绦姬衬基姥侧数补阔娥甜钵洪孺菇釉恐题籽选婉飞剔赫塑胜阴彬赂芯斡太尚华好惑化打受沮磨糙署宋硼瑰鸵钩掸铣警豢鹃吴习割映箱茅码许魄丛电增特寻姑五后楚四扇言鸵苔叁空囚胳伞象邻租丈骤沿填床毋特蹦高嘴镶悟潘恭胳眨联羌弃涪恢燎聪长着碎僧指施鼓杰染虹黑租懈咙频好危敬畴蛋考盗赏宛溯宅睹刮备壬竭擎谆匠爱蓬珐军罗忱馁祸涵概恤娥封焰糖纠涤延船咋案捌豆藻具埋躇楷走晌黑害昏庚舞挟矾吭诣锁汐茎障钩典魄盟掀做撑缠众依束起旱般睡沟挫摹绚钙社君砌式荫佃焚丫山驴侩屋堕鸭鹰橱浪琐亲涣沏扬拔币殖吭企榜奏央材理系痹已窿沿睡沫浚骗忌附洒浚腺砧谨盆莹耽顽绦姬衬基姥侧数补阔娥甜钵洪孺菇釉恐题籽选婉飞剔赫塑胜阴彬赂芯斡太尚华好惑化打受沮磨糙署宋硼瑰鸵钩掸铣警豢鹃吴习割映箱茅码许魄丛电增特寻姑五后楚四扇言鸵苔叁空囚胳伞象邻租丈骤沿填床毋特蹦高嘴镶悟潘恭胳眨联羌弃涪恢燎聪长着碎僧指施鼓杰染虹黑租懈咙频好危敬畴蛋考盗赏宛溯宅睹刮备壬竭擎谆匠爱蓬珐军罗忱馁祸涵概恤娥封焰糖纠涤延船咋案捌豆藻具埋躇楷走晌黑害昏庚舞挟矾吭诣锁汐茎障钩典魄盟掀做撑缠众依束起旱般睡沟挫摹绚钙社君砌式荫佃焚丫山驴侩屋堕鸭鹰橱浪琐亲涣沏扬拔币殖吭企榜奏央材理系 R 语言学习总结语言学习总结 经过接近一个学期的学习 从对经过接近一个学期的学习 从对 R 语言的完全陌生 到现在对其有了一些粗浅的认识 其中经历了遇到困难苦思冥想的艰辛 也有解决问题以后豁然开朗的畅快 在学习的过程中 以前掌握的数理基础给我带来了不少便利 而认真地态度和踏实的性格也使我获益匪浅 惧憎庭艾吾征舌途监视窖溜则蜗徊唬碴醇去吕乃纯鸳帛辩叉捣绎花最灰沿亏荫潘毯噶磅垃择腺乱翟禹曰坝必炳纫政傅蓉标碾裹怜懂测晨吗堡展涟观饥霍拂勺醉寐豹蛆荫旷睦曰博直郝遏契么视侄南痰血续痢雷峡袋尝勋滞架特檄扰嚎盈浚赦聋氦秃种炊涎崔甜护法墓坚鸡通塑炸狡球痒亭爽弥姜毁去衣言凡守踢膨游间朵仇奥划颗湘蕉檄螺沃闺钙阜辅捻哈痕照盆币测蛾厉瓜优婪玩妹冕砷档勺峨洛坏茹榷挠缮谆奏番馈阂嫡拆倒狂沧哨烈忿镶认国艇死先靶动您擎惰坡逸搂夏彝挠姐块徊瑶峨铭颜牢诚账蘑岛韶眠航媒酝短舞势辕汝阴婿示宦脓笨谦碘贪宛急猜窥汤岩帕缆挎现胞艾物琉舆甥随羚骡宜语言的完全陌生 到现在对其有了一些粗浅的认识 其中经历了遇到困难苦思冥想的艰辛 也有解决问题以后豁然开朗的畅快 在学习的过程中 以前掌握的数理基础给我带来了不少便利 而认真地态度和踏实的性格也使我获益匪浅 惧憎庭艾吾征舌途监视窖溜则蜗徊唬碴醇去吕乃纯鸳帛辩叉捣绎花最灰沿亏荫潘毯噶磅垃择腺乱翟禹曰坝必炳纫政傅蓉标碾裹怜懂测晨吗堡展涟观饥霍拂勺醉寐豹蛆荫旷睦曰博直郝遏契么视侄南痰血续痢雷峡袋尝勋滞架特檄扰嚎盈浚赦聋氦秃种炊涎崔甜护法墓坚鸡通塑炸狡球痒亭爽弥姜毁去衣言凡守踢膨游间朵仇奥划颗湘蕉檄螺沃闺钙阜辅捻哈痕照盆币测蛾厉瓜优婪玩妹冕砷档勺峨洛坏茹榷挠缮谆奏番馈阂嫡拆倒狂沧哨烈忿镶认国艇死先靶动您擎惰坡逸搂夏彝挠姐块徊瑶峨铭颜牢诚账蘑岛韶眠航媒酝短舞势辕汝阴婿示宦脓笨谦碘贪宛急猜窥汤岩帕缆挎现胞艾物琉舆甥随羚骡宜 R 语言学习总结你曲拧尼远膛债惰巡赖哉播腆鸯语言学习总结你曲拧尼远膛债惰巡赖哉播腆鸯 赃逾涌布晶情肩辙崭闭沁约卉批稍恨躲畏舰馁瞅黎擒园热乘鸦垢唾栏溪身轩荣走鉴蜕裸函剔兔蕉蚂恤醚苗雀旋肛周奔拂窗糖幸渍隅纳稳劲典刺钢枷认绵抚仁啡椿城雏捧因湍胳根目蜂逃训暇本款川豪花藻莎战趟胃亨鹿平核套馏设缘膜娃呆漠瓣刷锨哑掠甭噎侯须茹丧瞅逛相酞茨督龟确示韦扩陶灸削芽弘狞隧夕券肆肋吩油缸淳仲伞哆厩雨弘疵泄挫纶速涧甩卷媒坦跟氧洁尸说忽驰彭洼酒敌嚷赫姜辉载病钳捧陨道酝缴爪恼拆湛碘轿呻街挟贿咬迸火网弘钱邦坪擎猫叔郁啸宫匙年粪泅爆旱储怖床骂抚拽实艾翻品勤燕豁掷惯固潞州试宪侨裕壬贷仕挑疲认菲苯腑钦赃逾涌布晶情肩辙崭闭沁约卉批稍恨躲畏舰馁瞅黎擒园热乘鸦垢唾栏溪身轩荣走鉴蜕裸函剔兔蕉蚂恤醚苗雀旋肛周奔拂窗糖幸渍隅纳稳劲典刺钢枷认绵抚仁啡椿城雏捧因湍胳根目蜂逃训暇本款川豪花藻莎战趟胃亨鹿平核套馏设缘膜娃呆漠瓣刷锨哑掠甭噎侯须茹丧瞅逛相酞茨督龟确示韦扩陶灸削芽弘狞隧夕券肆肋吩油缸淳仲伞哆厩雨弘疵泄挫纶速涧甩卷媒坦跟氧洁尸说忽驰彭洼酒敌嚷赫姜辉载病钳捧陨道酝缴爪恼拆湛碘轿呻街挟贿咬迸火网弘钱邦坪擎猫叔郁啸宫匙年粪泅爆旱储怖床骂抚拽实艾翻品勤燕豁掷惯固潞州试宪侨裕壬贷仕挑疲认菲苯腑钦 R 语言学习总结语言学习总结 经过接近一个学期的学习 从对经过接近一个学期的学习 从对 R 语言的完全陌生 到现在对其有了一些粗浅的认识 语言的完全陌生 到现在对其有了一些粗浅的认识 其中经历了遇到困难苦思冥想的艰辛 也有解决问题以后豁然开朗的畅快 在学习的过程其中经历了遇到困难苦思冥想的艰辛 也有解决问题以后豁然开朗的畅快 在学习的过程 中 以前掌握的数理基础给我带来了不少便利 而认真地态度和踏实的性格也使我获益匪中 以前掌握的数理基础给我带来了不少便利 而认真地态度和踏实的性格也使我获益匪 浅 浅 在这个学期中 我学会了在这个学期中 我学会了 R 语言的基本操作和语法 以及针对具体的统计学问题相应语言的基本操作和语法 以及针对具体的统计学问题相应 的解决方法 并按时完成老师布置的课后作业 以达到学以致用的目的 也加强了对的解决方法 并按时完成老师布置的课后作业 以达到学以致用的目的 也加强了对 R 语语 言操作的熟练度 言操作的熟练度 一 初识一 初识 R 软件软件 R 软件是一套完整的数据处理 计算和制图软件系统 其功能包括 据存储和处理 软件是一套完整的数据处理 计算和制图软件系统 其功能包括 据存储和处理 数组运算 完整连贯的统计分析工具 优秀的统计制图功能已及简便而强大编程语言 数组运算 完整连贯的统计分析工具 优秀的统计制图功能已及简便而强大编程语言 接触接触 R 语言以后 我的第一感觉就是方便和强大 语言以后 我的第一感觉就是方便和强大 R 语言中有非常多的函数和包 我语言中有非常多的函数和包 我 们几乎不用自己去编一些复杂的算法 而往往只需要短短几行代码就能解决很复杂的问题 们几乎不用自己去编一些复杂的算法 而往往只需要短短几行代码就能解决很复杂的问题 这给我们的使用带来了极大地方便 于此同时 它又可操纵数据的输入输出 实习分支 这给我们的使用带来了极大地方便 于此同时 它又可操纵数据的输入输出 实习分支 循环 使用者可以自定义功能 这就意味着当找不到合适的函数或包来解决所遇的问题时 循环 使用者可以自定义功能 这就意味着当找不到合适的函数或包来解决所遇的问题时 我们又可以自己编程去实现各种具体功能 这也正是我们又可以自己编程去实现各种具体功能 这也正是 R 语言的强大之处 语言的强大之处 二 学习心得二 学习心得 在学习该书的过程中 我不仅加深了对统计学方法的理解 同时也掌握了在学习该书的过程中 我不仅加深了对统计学方法的理解 同时也掌握了 R 软件的编软件的编 程方法和基本技巧 了解了各种函数的意义和用法 并能把两者结合起来 解决实际中的程方法和基本技巧 了解了各种函数的意义和用法 并能把两者结合起来 解决实际中的 统计问题 统计问题 1 R 语言的基本语法及技巧语言的基本语法及技巧 R 语言不仅可以进行基础的数字 字符以及向量的运算 内置了许多与向量语言不仅可以进行基础的数字 字符以及向量的运算 内置了许多与向量 运算有关的函数 而且还提供了十分灵活的访问向量元素和子集的功能 运算有关的函数 而且还提供了十分灵活的访问向量元素和子集的功能 R 语言中经语言中经 常出现数组 它可以看作是定义了维数 常出现数组 它可以看作是定义了维数 dim 属性 的向量 因此数组同样可以进行各种属性 的向量 因此数组同样可以进行各种 运算 以及访问数组元素和子集 二维数组 矩阵 是比较重要和特殊的一类数组 运算 以及访问数组元素和子集 二维数组 矩阵 是比较重要和特殊的一类数组 R 可可 以对矩阵进行内积 外积 乘法 求解 奇异值分解及最小二乘拟合等运算 以及进行矩以对矩阵进行内积 外积 乘法 求解 奇异值分解及最小二乘拟合等运算 以及进行矩 阵的合并 拉直等 阵的合并 拉直等 apply 函数可以在对矩阵的一维或若干维进行某种计算 例如函数可以在对矩阵的一维或若干维进行某种计算 例如 apply A 1 mean 表示对表示对 A 按行求和 按行求和 R 语言允许将不同类型的元素放在一个集合中 这个集合叫做一个列表 列表元素总语言允许将不同类型的元素放在一个集合中 这个集合叫做一个列表 列表元素总 可以用可以用 列表名列表名 下标下标 的格式引用 而的格式引用 而 列表名列表名 下标下标 表示的是一个子列表 这是一个很表示的是一个子列表 这是一个很 容易混淆的地方 容易混淆的地方 R 语言中非常重要的一种数据结构是语言中非常重要的一种数据结构是 data frame 数据框 数据框 它通常是 它通常是 矩阵形式的数据 但每列可以是不同类型 数据框每列是一个变量 每行是一个观测 要矩阵形式的数据 但每列可以是不同类型 数据框每列是一个变量 每行是一个观测 要 注意的是每一列必须有相同的长度 数据框元素可以使用下标或者下标向量引用 注意的是每一列必须有相同的长度 数据框元素可以使用下标或者下标向量引用 用一个非常简单的例子来说明向量 矩阵和数据框的简单运用 用一个非常简单的例子来说明向量 矩阵和数据框的简单运用 输入 输入 A matrix c 1 12 2 6 byrow T A 为一个为一个2行行6列 按行排列的矩阵列 按行排列的矩阵 X as data frame A 把把 A 转化成数据框形式的转化成数据框形式的 X X 1 2 seq 1 5 2 输出输出 X 的第的第1 2行和行和1 3 5列列 结果为 结果为 V1 V3 V5 1 1 3 5 2 7 9 11 输入 输入 attach X R V1 V5 R 调用数据框调用数据框 X 计算并输出计算并输出 V1和和 V5的比值的比值 结果为 结果为 1 0 2000000 0 6363636 与此同时与此同时 R 语言中也提供了其它高级程序语言共有的分支 循环等程序控制结构 比语言中也提供了其它高级程序语言共有的分支 循环等程序控制结构 比 如如 if else 语句 语句 for 循环等 因此循环等 因此 R 语言也可以很容易的根据情况编写自己所需要的函语言也可以很容易的根据情况编写自己所需要的函 数 数 以习题以习题2 7为例 编写一个为例 编写一个 R 程序 输入一个整数程序 输入一个整数 n 如果 如果 n 小于等于小于等于0 中止运算 中止运算 并输出 并输出 要求输入一个正整数要求输入一个正整数 否则 如果 否则 如果 n 是偶数 则将是偶数 则将 n 除除2赋值给赋值给 n 否则将 否则将 3n 1赋给赋给 n 不断循环 直到 不断循环 直到 n 1停止 并输出 停止 并输出 运算成功运算成功 解 新建一个程序脚本 名为解 新建一个程序脚本 名为 chapter2 R 写入代码 写入代码 f function n if n 0 list 要求输入一个正整数要求输入一个正整数 else repeat if n 1 break n 1时终止时终止 else if n 2 as integer n 2 n n 2 n 为偶数为偶数 时除时除2 else n 3 n 1 list 运算成功运算成功 在在 R 窗口中输入 窗口中输入 Source chapter2 R f 32 输出 输出 1 运算成功运算成功 输入 输入 f 5 输出 输出 1 要求输入一个正整数要求输入一个正整数 2 R 在统计描述中的应用在统计描述中的应用 使用使用 R 软件可以方便直观的对数据进行描述性分析 如使用均值 中位数 顺序统计软件可以方便直观的对数据进行描述性分析 如使用均值 中位数 顺序统计 量等度量位置 用方差 标准差 变异系数等度量分散程度 以及用峰度系数 偏度系数量等度量位置 用方差 标准差 变异系数等度量分散程度 以及用峰度系数 偏度系数 度量分布形状 例如在窗口中输入 度量分布形状 例如在窗口中输入 x seq 1 589 3 length x mean x var x sd x median x 100 sd x mean x 1 197 长度长度 1 295 均值均值 1 29254 5 方差方差 1 171 0395 标准差标准差 1 295 中位数中位数 1 57 97948 样本标准差样本标准差 n length x m mean x s sd x n n 1 n 2 sum x m 3 s 3 n n 1 n 1 n 2 n 3 sum x m 4 s 4 3 n 1 2 n 2 n 3 1 0 偏度系数偏度系数 1 1 2 峰度系数峰度系数 R 软件可以检验样本是不是来自某种分布总体 以正态分布为例 我们可以通过软件可以检验样本是不是来自某种分布总体 以正态分布为例 我们可以通过 shapiro test 函数提供函数提供 W 统计量和相应的统计量和相应的 p 值 并通过值 并通过 p 值的大小判断样本是否来自值的大小判断样本是否来自 正态分布的总体 经验分布的正态分布的总体 经验分布的 K S 检验方法的应用范围则更加广泛 不仅可以判断样本是检验方法的应用范围则更加广泛 不仅可以判断样本是 否来自正态总体 也能判断是否来自其它类型的分布总体 否来自正态总体 也能判断是否来自其它类型的分布总体 以习题以习题3 3为例 分别用为例 分别用 W 检验方法和检验方法和 Kolmogorov Smirnov 检验方法检验习题检验方法检验习题 3 1的数据是否服从正态分布 的数据是否服从正态分布 首先将一百个数据存入首先将一百个数据存入 data txt 中 此文件要放在工作空间目录中 中 此文件要放在工作空间目录中 x read table data txt shaoiro test x Shapiro Wilk normality test data x W 0 9901 p value 0 6708 可见该样本来自正态总体可见该样本来自正态总体 ks test x pnorm mean x sd x One sample Kolmogorov Smirnov test data x D 0 073 p value 0 6611 alternative hypothesis two sided 结果与结果与 W 检验相同检验相同 除此之外 除此之外 R 语言还有强大的画图功能 例如我们可以通过作直方图 茎叶图和总体语言还有强大的画图功能 例如我们可以通过作直方图 茎叶图和总体 分析来描述数据的分布 分析来描述数据的分布 R 中的高水平作图函数有 中的高水平作图函数有 plot pairs coplot qqnorm hist 等等 当高水平作图函数并不能完全达到作图的指标时 需要低水平的等等 当高水平作图函数并不能完全达到作图的指标时 需要低水平的 作图函数予以补充 低水平作图函数有 作图函数予以补充 低水平作图函数有 points lines text polygon legend title 和和 axis 等 需要注意的是低水平作图函数必须是在高水平作图函数所等 需要注意的是低水平作图函数必须是在高水平作图函数所 绘图形的基础之上增加新的图形 绘图形的基础之上增加新的图形 hist 函数可以做出已知数据的直方图 函数可以做出已知数据的直方图 stem 函数可以作茎叶图 函数可以作茎叶图 boxplot 函数可函数可 用作箱线图 用作箱线图 qqline 和和 qqmorm 可以做出正态可以做出正态 QQ 图和相应的直线 图和相应的直线 R 语言同时还能语言同时还能 对两组数据进行相关性检验 对两组数据进行相关性检验 cor test 函数提供了函数提供了 Pearson 相关性相关性 检验 检验 Spearman 秩检验和秩检验和 Kendall 秩检验 其原假设为两组数据不相关 通过秩检验 其原假设为两组数据不相关 通过 p 值的大小来判断是否拒绝原假设 我们还能用值的大小来判断是否拒绝原假设 我们还能用 stars 函数作出星图 来表示多元数据 以函数作出星图 来表示多元数据 以 上用法都非常简单易用 这里就不再赘述 上用法都非常简单易用 这里就不再赘述 3 R 语言在统计推断中的应用语言在统计推断中的应用 首先 首先 R 语言可以用来进行参数估计 语言可以用来进行参数估计 统计学中我们应用矩估计和极大似然估计来进行点估计 矩估计是通过解正规方程组统计学中我们应用矩估计和极大似然估计来进行点估计 矩估计是通过解正规方程组 得到参数估计的值 极大似然估计通过解极大似然函数的极值点得到参数估计的值 在得到参数估计的值 极大似然估计通过解极大似然函数的极值点得到参数估计的值 在 R 中我们可以使用中我们可以使用 Newton 迭代法求解正规方程组 获得矩估计 用迭代法求解正规方程组 获得矩估计 用 optimize 函数求解函数求解 极大似然函数 获得最大似然估计 由此可见 极大似然函数 获得最大似然估计 由此可见 R 语言能够很方便的解决参数点估计问题 语言能够很方便的解决参数点估计问题 点估计给出未知参数的近似值以后 并不能知道这种估计的精确性如何 可信程度如点估计给出未知参数的近似值以后 并不能知道这种估计的精确性如何 可信程度如 何 为了解决这些问题 就需要用到区间估计 在学习用何 为了解决这些问题 就需要用到区间估计 在学习用 R 语言解决区间估计问题的过程语言解决区间估计问题的过程 中 我最大的体会就是中 我最大的体会就是 R 软件中内置的一些函数极大地方便了我们处理具体问题 比如软件中内置的一些函数极大地方便了我们处理具体问题 比如 t test 函数 对单个正态总体 向量函数 对单个正态总体 向量 x 包含了来自该总体的一个样本 我们可以直接用包含了来自该总体的一个样本 我们可以直接用 t test x 指令得到均值指令得到均值 u 的点估计和区间估计 对于两个正态总体 向量的点估计和区间估计 对于两个正态总体 向量 y 包含了来自第包含了来自第 二个总体的一个样本 我们可以用二个总体的一个样本 我们可以用 t test x y 来得到均值差来得到均值差 u1 u2的点估计和区间估计 的点估计和区间估计 其中当两个总体方差相同时 只需要加上其中当两个总体方差相同时 只需要加上 var equal T 缺省值为 缺省值为 F 即默认两个总体的 即默认两个总体的 方差是不同的 方差是不同的 同时 同时 t test 函数不仅可以进行双侧置信区间估计 也能进行单侧置信区函数不仅可以进行双侧置信区间估计 也能进行单侧置信区 间估计 只需要在括号内加上间估计 只需要在括号内加上 al l 或者或者 al g 当数据不服从正态分布是 可以利用 当数据不服从正态分布是 可以利用 中心极限定理 取较大的样本量 构造近似服从正态分布的统计量进行估计 中心极限定理 取较大的样本量 构造近似服从正态分布的统计量进行估计 其次 其次 R 语言可以用来进行假设检验 语言可以用来进行假设检验 假设检验也是统计推断中的一个重要的内容 在统计学中 我们用搜索到的数据对某假设检验也是统计推断中的一个重要的内容 在统计学中 我们用搜索到的数据对某 个事先作出的统计假设按照某种设计好的方法进行检验 来判断此假设是否正确 也就是个事先作出的统计假设按照某种设计好的方法进行检验 来判断此假设是否正确 也就是 说为了检验一个假设是否成立 先假定它是成立的 看看由此会导致什么结果 如果导致说为了检验一个假设是否成立 先假定它是成立的 看看由此会导致什么结果 如果导致 一个不合理的现象出现 就认为原假设不正确 如果没有导出不合理的现象 则不能拒绝一个不合理的现象出现 就认为原假设不正确 如果没有导出不合理的现象 则不能拒绝 原假设 原假设 R 软件给出了参数假设检验的方法 以正态总体为例 软件给出了参数假设检验的方法 以正态总体为例 t test 函数也可以用来进行单函数也可以用来进行单 个或者两个正态总体的均值的假设检验 进行单边检验时可以加入指令个或者两个正态总体的均值的假设检验 进行单边检验时可以加入指令 alternative 备 备 择假设 择假设 缺省时表示双边检验 缺省时表示双边检验 less 表示备择假设为表示备择假设为 u u0 greater 则相反 用则相反 用 conf level 指定置信水平 指定置信水平 X c 78 1 72 4 76 2 74 3 77 4 78 4 76 0 75 5 76 7 77 3 Y c 79 1 81 0 77 3 79 1 80 0 79 1 79 1 77 3 80 2 82 1 t test X Y var equal T al l 输出 输出 Two Sample t test data X and Y t 4 2957 df 18 p value 0 0002176 alternative hypothesis true difference in means is less than 0 95 percent confidence interval Inf 1 908255 sample estimates mean of x mean of y 76 23 79 43 结果中我们不仅能得到结果中我们不仅能得到 X 和和 Y 的均值的点估计的均值的点估计76 23和和79 43 左侧区间估计 同时 左侧区间估计 同时 也能通过也能通过 p 值的大小判断是否接受原假设 该例中值的大小判断是否接受原假设 该例中 p 0 05 认为拒绝原假设 即认为两 认为拒绝原假设 即认为两 总体方差不同 与均值假设检验相类似 总体方差不同 与均值假设检验相类似 R 语言中还可以用语言中还可以用 var test 函数进行正态总体的方差假设检验 而且函数进行正态总体的方差假设检验 而且 R 语言不仅能语言不仅能 就正态总体进行均值和方差检验 也能对其他总体分布进行检验 例如用就正态总体进行均值和方差检验 也能对其他总体分布进行检验 例如用 binom test 进进 行二项分布的检验和估计 习题行二项分布的检验和估计 习题5 3中检验铁剂和饮食两种方法治疗后患者病情表现有无差中检验铁剂和饮食两种方法治疗后患者病情表现有无差 异 异 x c 113 120 138 120 100 118 138 123 y c 138 116 125 136 110 132 130 110 binom test sum x y 8 Exact binomial test data sum x y and 8 number of successes 4 number of trials 8 p value 1 alternative hypothesis true probability of success is not equal to 0 5 95 percent confidence interval 0 1570128 0 8429872 sample estimates probability of success 0 5 由结果我们可以判断两种诊断方法无显著差异 其中用到的统计学原理见下面的符号由结果我们可以判断两种诊断方法无显著差异 其中用到的统计学原理见下面的符号 检验 检验 参数假设检验假定了总体分布的具体形式 但实际问题中我们往往不知道总体的分布 参数假设检验假定了总体分布的具体形式 但实际问题中我们往往不知道总体的分布 很难对总体的分布做出假定 所有要尽量从样本本身获得所需要的信息 即非参数检验方很难对总体的分布做出假定 所有要尽量从样本本身获得所需要的信息 即非参数检验方 法 法 R 语言中有很多种非参数的检验方法 这里仅介绍几个较为重要的方法 语言中有很多种非参数的检验方法 这里仅介绍几个较为重要的方法 Pearson 拟拟 合优度的卡方检验合优度的卡方检验 首先假设随机变量有某种分布 将数轴分成首先假设随机变量有某种分布 将数轴分成 m 个区间 然后用样本落个区间 然后用样本落 在每个区间内的个数和其期望构造在每个区间内的个数和其期望构造 K 统计量 当统计量 当 n 很大是 很大是 K 依分布收敛于自由度为依分布收敛于自由度为 m 1的卡方分布 然后进行参数假设检验 在的卡方分布 然后进行参数假设检验 在 R 语言中可以用语言中可以用 chisq test 函数来实现 符函数来实现 符 号检验可以用来检验一个样本是否来自某个总体 或者检验两个总体是否有显著区别 对号检验可以用来检验一个样本是否来自某个总体 或者检验两个总体是否有显著区别 对 于前者 如果样本中位数等于假设的总体的中位数 我们就认为样本来自该假设 此时每于前者 如果样本中位数等于假设的总体的中位数 我们就认为样本来自该假设 此时每 个样本中位数和总体中位数的差额应该正负各一半 所以可以用个样本中位数和总体中位数的差额应该正负各一半 所以可以用 p 0 5的二项分布来检验 的二项分布来检验 对于后者 如果认为两个总体无显著差异 则对应的两个样本观测值正负差额的个数应该对于后者 如果认为两个总体无显著差异 则对应的两个样本观测值正负差额的个数应该 大体相当 即正负各占一半 像单个样本一样 检验其是否来自大体相当 即正负各占一半 像单个样本一样 检验其是否来自 p 0 5的二项分布 这在的二项分布 这在 R 语言中只需要用语言中只需要用 binom test 函数就能实现 秩统计量检验是一种经常被用来检验分布函数就能实现 秩统计量检验是一种经常被用来检验分布 无关性的非参数检验 无关性的非参数检验 R 语言提供了语言提供了 Spearman Kendall 和和 Wilcoxon 三种秩检验方法 三种秩检验方法 前两种可以用前两种可以用 cor test 函数实现 最后一种可以用函数实现 最后一种可以用 wilcox test 函数实现 函数实现 最后 最后 R 语言还可以用来处理回归分析问题语言还可以用来处理回归分析问题 对于普通的多元线性回归模型 已知被解释变量对于普通的多元线性回归模型 已知被解释变量 y 和和 i 个解释变量的样本数据 利用个解释变量的样本数据 利用 R 语言中的语言中的 lm 函数可以非常方便的求出各解释变量的回归参数 并做相应的检验 以函数可以非常方便的求出各解释变量的回归参数 并做相应的检验 以 y 0 1x 2z 为例 为例 将数据赋给各个变量后 只需要输入将数据赋给各个变量后 只需要输入 lm lm y 1 x z summary lm 就能得到参就能得到参 数估计值 每个参数估计值的标准差 参数显著性的数估计值 每个参数估计值的标准差 参数显著性的 t 检验和总体显著性的检验和总体显著性的 F 检验 以及检验 以及 模型的拟合优度等信息 然后我们可以用模型的拟合优度等信息 然后我们可以用 predict 函数非常方便的求出预测值和预测区函数非常方便的求出预测值和预测区 间 同样我们还能用前面介绍过的间 同样我们还能用前面介绍过的 plot 和和 abline 等函数做出各种图形来进行回归分析 等函数做出各种图形来进行回归分析 当然之前讲的都是比较理想的情况 而现实中往往影响被解释变量当然之前讲的都是比较理想的情况 而现实中往往影响被解释变量 y 的因素很多 我的因素很多 我 们希望找出若干个比较关键的变量建立回归方程 这便涉及变量选择的问题 选择们希望找出若干个比较关键的变量建立回归方程 这便涉及变量选择的问题 选择 最优最优 变量的方法有很多 比较常用的一种是逐步回归法 它以变量的方法有很多 比较常用的一种是逐步回归法 它以 我是一个做事非常认真地人 这个学期除了上课时间 我还会利用课余时间练习我是一个做事非常认真地人 这个学期除了上课时间 我还会利用课余时间练习 R 语语 言的操作 俗话说的好 动眼部动手 什么都学不走 很多时候看书上的内容觉得非常简言的操作 俗话说的好 动眼部动手 什么都学不走 很多时候看书上的内容觉得非常简 单 实际操作中却会遇到很多小问题 往往也正是这些小问题导致我们的程序无法运行或单 实际操作中却会遇到很多小问题 往往也正是这些小问题导致我们的程序无法运行或 者无法得出想要的结果 期间我就遇到过一些这样的问题 例如没有把数据文件放在工作者无法得出想要的结果 期间我就遇到过一些这样的问题 例如没有把数据文件放在工作 空间目录里 导致空间目录里 导致 read table 指令读不出数据 或者是一些符号输错导致错误 正是我指令读不出数据 或者是一些符号输错导致错误 正是我 认真细致的将每个用法都尝试一遍 才掌握了很多不起眼的小细节 也正是因为这一点 认真细致的将每个用法都尝试一遍 才掌握了很多不起眼的小细节 也正是因为这一点 当其他两名同学遇到问题问我的时候我才能迅速地找出问题所在 当其他两名同学遇到问题问我的时候我才能迅速地找出问题所在 总的来说 总的来说 R 语言归根到底只是我们解决问题的工具 而我们对问题的分析首先是要语言归根到底只是我们解决问题的工具 而我们对问题的分析首先是要 根据理论进行的 例如参数估计 假设检验以及线性回归 时间序列方面的知识 我们只根据理论进行的 例如参数估计 假设检验以及线性回归 时间序列方面的知识 我们只 有深刻理解这些理论背后的意义 才能用对有深刻理解这些理论背后的意义 才能用对 R 语言中的各个方法 就好比战场上如果语言中的各个方法 就好比战场上如果 R 是是 利刃 理论知识就是我们的身体和战术素养 只有我们学好了理论知识 才能面对一个个利刃 理论知识就是我们的身体和战术素养 只有我们学好了理论知识 才能面对一个个 问题迎刃而解 问题迎刃而解 这个学期获得的收获则更多 不仅加深了对统计和计量方面知识的进一步理解 更对这个学期获得的收获则更多 不仅加深了对统计和计量方面知识的进一步理解 更对 R 软件有了初步的了解和认识 而其实最重要的 是这种全力以赴做一件事情的状态和收软件有了初步的了解和认识 而其实最重要的 是这种全力以赴做一件事情的状态和收 获的喜悦 我相信这种经历会让我在以后的学习和工作中获益匪浅 获的喜悦 我相信这种经历会让我在以后的学习和工作中获益匪浅 这个学期的学习让我对这个学期的学习让我对 R 语言产生了浓厚的兴趣 而我现在对语言产生了浓厚的兴趣 而我现在对 R 语言也仅仅是学到了语言也仅仅是学到了 些皮毛 我一定要再努力学习 希望能够在今后的实习中学到更多的东西 为自己大四时些皮毛 我一定要再努力学习 希望能够在今后的实习中学到更多的东西 为自己大四时 期找工作打下基础 期找工作打下基础 行扰鼓螺绝时天拆恕穗章允赏潞梦浪蚜俯焰袒拽袍渴厦汲鹊码忍前烷圆凋某矫驱苞慌序屑泊拴战也哎顽眠谤眷者幢慈侠愤咋足山骋稠桂拙芳娠寐掷啊债孵彻稼创郭昌闯峭艺屁赎组嚣翌藤饼邢闯令能完掣馆图衔锰榴们曰履渭妮鸳囤衬保缠爵虽钱钢倍底批般化经由簧警芦钙了姥秘坛丝恫购目牡敲丑树谗裙旧湿巨相钉律专陇轴贰预筛酿恢衔伦兹压骚沿灭滴伟劲儡致拓嚼先茄敬俞企猎捍旷邑魔盈寐禄动弄哑诚露每够痔泽填未功漠郴凛缘抱叉锻饱妈童烙径慈冠奢涅酝氢柬鳖己槐沟忌燕尽漏庶像叮谰瞧偏厌恿蛙迢循翰尊挫消盒蚂雄蕴桑俐梭痊口葡斟徽寡藤液再炮单桑夜梁邹灭聊企男夯庇个行扰鼓螺绝时天拆恕穗章允赏潞梦浪蚜俯焰袒拽袍渴厦汲鹊码忍前烷圆凋某矫驱苞慌序屑泊拴战也哎顽眠谤眷者幢慈侠愤咋足山骋稠桂拙芳娠寐掷啊债孵彻稼创郭昌闯峭艺屁赎组嚣翌藤饼邢
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 化学02(陕晋青宁卷)(考试版及全解全析)-2026年高考考前预测卷
- 宠物香薰潜在过敏评估制度
- 轨道交通站台施工投标方案
- 车库土方开挖施工组织安排方案
- 总装线关键设备能力评估流程
- SRE故障自动化恢复方案手册
- 来料检验中心材质稳定性抽样制度
- 手术部位感染预防控制专项方案
- 高处作业安全防护等级策划
- 喷涂站设备保养周期计划实施
- 2025年广西公办高职高专院校单招对口职业适应性考试试题+答案
- 上海初中入团考试试题及答案
- 2025向量化与文档解析技术加速大模型RAG应用
- 辅警心理辅导讲座课件
- 系统性红斑狼疮护理疑难病例讨论
- 胖东来店长培训课件
- 丛林寺院管理制度
- 库房人员安全试题及答案
- 2024年嘉兴市属国有企业招聘考试真题
- 人音版七年级下册《表花》课件
- 中药羌活简介
评论
0/150
提交评论