版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
[42]本研究最终选定文心智能体平台作为开发并训练智能体的核心工具,旨在构建一个高度互动且个性化的虚拟教学环境。本智能体系统精心设计了三位各具特色的虚拟教师角色,他们不仅具备丰富的专业知识,还擅长从不同维度对学生的演讲表现进行精准点评,以此促进学生演讲能力的全面提升。智能体将扮演三个虚拟教师,如图2-1图3-SEQ图\*ARABIC\s11虚拟教师智能体图Figure3-1VirtualTeacherIntelligentAgentDiagram教师A(内容专家):作为内容领域的权威,教师A专注于评估学生演讲的深度、逻辑性和创新性。通过深入分析演讲内容,教师A能够精准指出学生是否清晰传达了核心观点,内容是否引人入胜且具有说服力,以及是否展现了独特的思考角度。在点评时,教师A会结合具体案例,提出改进建议,帮助学生优化内容结构,增强演讲的吸引力和影响力。教师B(表达教练):教师B则是一位表达技巧的大师,他密切关注学生的语速、语调、肢体语言及眼神交流等细节。通过实时观察,教师B能够即时反馈学生的表达状态,提供关于如何更有效地运用语言、调整语速以维持听众兴趣、以及如何通过非言语方式增强表达效果的宝贵建议。在点评过程中,教师B会亲自示范正确的表达方式,帮助学生逐步掌握演讲的艺术。教师C(互动导师):作为互动领域的专家,教师C特别重视学生与听众之间的互动效果。他通过分析学生的眼神交流频率、提问技巧及应对听众反馈的能力,评估学生的互动水平。在点评时,教师C会引导学生如何更好地建立与听众的联系,如何根据听众的反应灵活调整演讲策略,以及如何有效回应听众的提问和反馈。通过模拟真实场景中的互动练习,教师C帮助学生提升演讲的互动性和说服力。本智能体系统被巧妙地部署在虚拟现实(VR)课堂中,三位虚拟教师以3D动画化身的形式存在,与真实教师和学生进行无缝互动。在学生完成演讲后,系统会自动分析眼神交流频率等关键指标,并将演讲内容文本发送给智能体。随后,教师智能体根据预设的行为分类,精准生成相应的动作信号(如鼓掌、点头以示鼓励)或对话响应(如提问、点评、讨论等)。动作信号通过预录制的身体动作实现,确保虚拟教师的反馈既生动又真实;而对话响应则通过集成的语音合成功能,将文本转换为自然流畅的语音,为学生提供亲切而专业的指导。3.2智能体的训练流程对于智能体的训练,本研究采用了文心智能体平台的零代码训练方式。主要采用的是prompt工程的方式图3-SEQ图\*ARABIC\s12智能体的相关设置与prompt工程Figure3-2:RelevantSettingsandPromptEngineeringofIntelligentAgents“教室演讲聆听者”是一个专为学生演讲点评和辅导打造的AI智能体。其训练配置涵盖多方面内容,旨在使其具备出色的交互与辅导能力,具体设置过程如图3-2在基本信息层面,明确名称为“教室演讲聆听者”,简介阐述其作为学生演讲点评和辅导AI助手的定位,为后续功能设定奠定基础。开场环节精心设计。开场文案设定为“您好!可以开始你的演讲了!”,简洁明了地引导学生开启演讲。同时,系统可依据历史对话为老用户动态生成开场文案,增强交互的个性化。在角色规范上,扮演聆听者角色,于学生演讲完毕后进行点评和辅导,根据表现给出具体反馈与建议,且当学生更换主题再次演讲时,重复点评流程,确保全程辅导。思考规范要求在演讲过程中密切关注学生眼神交流、情感表达、内容分析等方面,演讲结束后基于观察给出具体点评,如指出语言表达的流畅度、逻辑结构的严密性等问题,助力学生提升演讲能力。回复内容需要包含文本信号和动作信号,最后可以调用响应脚本来完成对应的动作。3.3智能体的调用在本研究中,智能体的调用是一个非常重要的环节。对于虚拟教师智能体的API调用方式,主要的输入为被测者演讲语音转化后的文本和被测者的眼动注视频率。通过API方式将输入发送到智能体,智能体根据预训练得到的知识,对被测者的演讲进行点评,不仅对演讲内容本身进行点评,同时,也会对演讲的语速,眼神交流进行点评。具体调用方式如图3-3图3-3智能体调用流程图Figure3-3:IntelligentAgentCallingProcessFlowchart如图所示,流程开始后,首先进行相关参数的初始化,包括appId、secretKey
等。这些参数是用于后续与文心智能体API进行交互时的身份验证和授权信息。初始化完成后,启动语音识别和注视点频率检测。语音识别用于捕获用户的语音输入并转换为文本信息;注视点频率检测则用于监测用户的眼动数据,获取注视点频率信息.当检测到有输入时,系统获取对应的文本信息(通过语音识别转换而来)以及注视点频率信息。将获取到的文本信息和注视点频率信息整合到请求体中,按照文心智能体API要求的格式构建请求体。构建完成后,使用
HttpClient
工具向指定的
apiUrl。等待文心智能体的响应,检查请求是否成功。如果请求失败(例如,网络连接问题、API调用错误等),则输出错误信息,继续检查是否有新的输入如果请求成功,接收到文心智能体返回的响应数据。对响应数据进行解析,将JSON格式的响应数据转换为程序中可处理的对象。从解析后的响应数据中提取出文本信号(智能体的回复内容)和动作信号(响应中包含了指示系统执行特定动作的信号)。至此,一次完整的调用文心智能体并处理相关输入输出的过程结束4.社交焦虑系统的输入输出4.1语音识别在虚拟现实社交焦虑测评平台中,为了实现用户与虚拟环境的自然交互,我们集成了语音识别技术。语音识别技术允许用户通过语音指令与虚拟智能体进行交互,从而增加了系统的沉浸感。在语音技术的选型中,本研究综合考虑了识别率,响应速度,多语言支持以及集成难度等。经过对比测试,最后选择了Unity中内置的DictationRecognizer类作为语音识别工具。DictationRecognizer类是Unity为Windows平台提供的一个语音识别接口,它支持实时语音转文字的功能,并且能够方便地集成到unity项目中DictationRecognizer
类通过监听用户的语音输入,并触发相应的事件来处理识别结果。具体来说:DictationResult
事件:当用户说话暂停(通常是句子结束时)触发,返回完整的识别字符串,并带有识别的置信度。DictationHypothesis
事件:在用户说话过程中连续触发,提供当前识别的文本内容,这些内容可能是不完整的。DictationComplete
事件:当识别器停止时触发,用于判断语音输入是否完整完成。DictationError
事件:当语音识别过程中发生错误时触发,提供错误信息和错误代码。具体的流程如图4-1,该流程图展示了从初始化语音识别器开始,到处理语音输入、获取识别结果并最终调用相关方法的整个过程。在语音识别过程中,根据不同的事件触发相应的处理逻辑,并在识别完成或出现错误时进行相应的操作。实现了一个基本的语音识别功能,能够监听用户的语音输入,识别出语音内容,并根据识别结果进行相应的处理。图4-SEQ图\*ARABIC\s11语音识别流程图Figure4-1:VoiceRecognitionProcessFlowchart4.2眼动信息的输入4.2.1实验眼动信息的收集在虚拟现实(VirtualReality,VR)系统中,准确估算用户的注视点(gazepoint)是实现自然人机交互的关键技术之一。通过精确追踪用户眼睛的注视方向,可以实现基于视线的交互机制,例如注视选择、区域聚焦、兴趣点分析等。特别是在多模态情绪识别、注意力分布研究、虚拟课堂教学反馈等应用中,注视点的空间定位提供了重要的认知和行为指标。本研究编写了收集眼动信息的相关脚本,实现了一个基于UnityXR框架的眼动追踪数据采集系统,通过VR/AR设备的传感器阵列实现多模态眼动参数的高频采样(10Hz),并将结构化数据持久化存储为CSV格式。该系统可同步捕获眼球运动学参数、头部姿态信息及空间注视特征。如图4-2所示,为收集到的部分数据。图4-SEQ图\*ARABIC\s12眼动信息收集CSV表 Figure4-2:EyeMovementInformationCollectionCSVTable由图可以看到,本研究收集眼动信息的时间单位为时间戳,频率为10HZ。首先我们会收集瞳距(InterpupillaryDistance,IPD),其生理意义为左右眼瞳孔中心点的空间距离,是评估视觉系统解剖特征的基础参数。其中P_left和P_right为左右眼空间坐标,通过XRNode.LeftEye和XRNode.RightEye节点获取三维空间坐标,计算欧式距离(公式4-1)IPD=||P_left−P_right||₂4-1其次收集了单眼瞳孔距离,分别包括左眼瞳孔距LPD(左眼到头部空间的距离)和右眼瞳孔距LPD(右眼到头部空间的距离)(公式4-2)PD=||P_head−P_eye||₂4-2其反应了眼眶在眼眶内的运动幅度,可以用于分析眼动范围还收集了头部姿态角(公式4-3)θ4-3还有眼球凝视方向(EyeGazeDirection),其向量定义以下公式4-4G=Q_eye∗Vector3.forward4-4通过眼球旋转四元数Q_eye将局部坐标系前方向量(0,0,1)转换至世界坐标系,用来计算视线夹角,注视方向一致性等空间特征最后,脚本中还有收集了注视点,本次实验用到的最重要的眼动信息,注视点计算的核心思想是:从左右眼出发,沿其注视方向在三维空间中投射射线,寻找这两条射线之间的最短连线,并以其两端点的中点作为用户当前注视的目标点估计值。由于人眼存在一定程度的视差,两条注视光线一般不会严格相交,因此需求解其“最接近点对”。上述计算过程采用了射线参数方程和向量运算相结合的方式,步骤如下:
1.空间射线模型的构建:
左右眼位置分别为向量OL与OR,注视方向为单位向量DL与DR。两条射线的 空间参数形式分别如公式4-5,其中t和s表示沿各自方向延伸的距离。PL(t)=OL+tDL,4-5
2.构建约束条件:
两点之间的最短距离线段应垂直于两条方向向量的叉积(公式4-6):(PL(t)−PR(s))⋅(DL×DR)=04-6 3.推导最近点参数:
可根据向量投影原理和垂直性条件,导出参数解t*与s*。4.特殊情况处理:
如公式4-7,若1−(DL⋅DR)^2≈0,表示方向向量近似平行,使用眼睛中 点代替注视点。Gapprox=(OL+OR)/24-7
5.最终注视点估计(公式4-8):G=(PL(t∗)+PR(s∗))/24-8该算法在考虑计算精度的同时,提供了一套稳定性保障机制:
-抗平行干扰:当两条注视射线几乎平行时,使用眼睛中点作为近似值。
-抗抖动设计:通过取两点中点,可降低高频噪声影响,适用于实时系统。
-局部光滑性:随着眼睛位置和方向变化平滑过渡,适合稳定渲染注视热区。4.2.2眼动信息分析与使用在判断注视点是否在虚拟人脸上时,首先需要明确虚拟人面部在虚拟场景中的空间坐标范围。通过对虚拟人模型的分析,确定其面部的边界框坐标。对于计算得到的每个注视点,将其坐标与虚拟人面部边界框坐标进行比对。若注视点坐标在边界框范围内,则判定该注视点位于虚拟人脸上。为了更直观地展示眼动数据与虚拟人面部的关系,我们设定了眼神交流频率这一指标。眼神交流频率通过统计单位时间内注视点落在虚拟人脸上的次数来计算。例如,在被测者演讲的整个过程中,以10秒为一个统计区间,统计该区间内注视点在虚拟人脸上出现的次数,将这个次数除以10,即可得到该区间内的眼神交流频率。通过对不同演讲阶段眼神交流频率的分析,可以了解被测者在与虚拟人互动时,不同时间点的紧张程度和注意力集中情况。一般来说,较低的眼神交流频率可能意味着被测者在该时刻较为紧张,不敢与虚拟人进行眼神接触;而较高的眼神交流频率则可能表示被测者相对放松,能够自然地与虚拟人进行互动。为了更清晰地呈现眼动数据的分布情况,我们将场景图截图,并把眼动数据点转化成热力图叠加在场景图上。具体实现过程如下:首先,从眼动数据采集系统中提取出一段时间内(如整个演讲过程)的所有注视点数据;然后,使用python脚本将这些注视点数据转换为热力图格式。在转换过程中,软件会根据注视点的分布密度和停留时间,对不同区域赋予不同的颜色和透明度,颜色越深、透明度越高的区域表示注视点越集中、停留时间越长。最后,将生成的热力图与虚拟场景截图进行叠加,使研究者能够直观地看到被测者在虚拟场景中的注视热点区域,特别是与虚拟人面部相关的注视情况。如图4-3,得到眼动频率后,在调用时,将眼动频率和文本信息一起发送到智能体交互层。图4-SEQ图\*ARABIC\s13注视点热力图Figure4-3Heatmapoffixationpoints4.2语音合成在虚拟现实社交焦虑测评平台中,为了实现用户与虚拟环境的自然交互,并提升系统的沉浸感和用户体验,本研究集成了语音合成技术。语音合成技术允许系统将文本信息转换为自然流畅的语音输出,从而模拟真实人类对话,增强用户与虚拟智能体之间的交互效果。本研究综合考虑了语音合成的自然度、流畅度、多语言支持以及集成难度等因素,最终选择了有道语音合成服务作为本系统的语音合成解决方案。有道语音合成服务以其高质量的语音输出、灵活的API接口以及丰富的语言支持,为本研究提供了强有力的技术支持。图4-SEQ图\*ARABIC\s14语音合成流程图Figure4-3:VoiceSynthesisProcessFlowchart首先构建请求参数:确定请求地址/ttsapi,并准备一系列请求参数。包括待合成的文本q,指定语言类型langType
,应用ID
appKey,随机生成的盐值salt(这里使用当前时间的毫秒数)。同时,将appKey、q、salt和应用密钥appSecret拼接成字符串进行MD5加密,得到签名sign
,以保证请求的安全性和合法性。然后发送请求获取音频数据:使用HttpWebRequest发起POST请求,将构建好的参数以application/x-www-form-urlencoded格式发送到指定的API地址。服务器接收请求并处理后,返回包含合成语音的二进制音频数据。最后保存音频文件:将获取到的音频数据保存为本地的MP3文件。在Unity项目中,文件保存路径设置为Application.dataPath+"/FirstAudio.mp3"。保存完成后,通过UnityEditor.AssetDatabase.Refresh()刷新项目资源,确保新生成的音频文件能在项目中正常显示和使用。如图3-2,完整展示了从准备工作到最终合成并保存语音文件的全部过程,各步骤紧密相连,共同实现了在Unity项目中使用有道语音合成服务的功能5.场景设计本研究的核心在于构建一个高度逼真且具有沉浸感的虚拟现实社交焦虑测评场景,以模拟现实生活中的社交压力环境,从而准确评估被测者的社交焦虑水平。经过精心设计与规划,我们主要聚焦于公共演讲这一具有代表性的社交场景,同时,也为未来可能扩展的其他社交场景奠定了基础。公共演讲作为社交焦虑测评中的经典场景,能够充分激发被测者的紧张情绪,为评估其社交焦虑水平提供有力依据。场景设计遵循真实感、互动性和可控性的原则。真实感体现在对大学教室环境的细致模拟,包括空间布局、光影效果、声音环境等;互动性则通过智能体与被测者的自然对话交互实现,增强用户的沉浸感;可控性则确保实验过程中的各种变量可以被精确控制,以便后续的数据分析和结果验证场景模拟了一个典型的大学教室,内部布置包括讲台、黑板、学生座位以及投影仪等设备,力求还原真实的课堂环境。讲台位于教室前方,是演讲者的主要活动区域;学生座位则分布在讲台前方和两侧,形成半包围结构,以模拟真实的听众布局,场景示例如图4-1,4-2所示:图5-1教室场景俯视图图5-SEQ图\*ARABIC\s11教室场景平视图Figure4-1:ClassroomScenePlanView场景中特别设置了10个虚拟观众和3个虚拟评委。虚拟观众分布在不同座位上,表现出多样化的表情和动作,如点头、微笑、记录笔记等,以营造真实的听众反应。虚拟评委则由智能体驱动,具备强大的自然语言处理能力,能够根据演讲者的表现进行实时评估和反馈。评委们坐在教室前排,表情严肃,偶尔会做笔记,以体现其专业性和权威性。如图5-3所示图5-SEQ图\*ARABIC\s13虚拟教师场景内截图Figure5-3:Screenshotofvirtualteacherscene6社交焦虑实验6.1社交焦虑问卷设计本问卷用于评估参与者在公共演讲中的状态焦虑,对虚拟智能评委的感知,用户体验以及相关控制变量。所有Likert题默认使用5点量表(1=非常不同意,5=非常同意),除非另有说明。状态公共演讲焦虑(StatePublicSpeakingAnxiety)参与者在VR演讲任务开始前与结束后,分别使用主观不适单位量表(SUDS)评估当前的焦虑、紧张或不适感。评分范围为0(完全不焦虑)至100(极度焦虑),如图6-1图6-SEQ图\*ARABIC\s11状态公共演讲焦虑Figure6-1:statepublicspeakinganxiety,如图6-2,其次是对虚拟智能体(IA)的感知测量,参与者对虚拟智能体评委的社交性通过12个形容词条目评估,借鉴自Powers和Kiesler的社交性感知量表,例如“热情的”“友善的”“亲切的”“值得信赖的”等图6-SEQ图\*ARABIC\s12社交性感知量表Figure6-2:socialperceptivenessscale如图6-3,还有人际亲密感通过7个项目测量,评估互动中是否产生了亲近、情感联系或冷漠疏远感。样题包括:“我觉得自己与这个虚拟评委很亲近”、“它让我感受到一种距离感(反向题)”、“它在与我互动时很冷漠(反向题)”等。图6-SEQ图\*ARABIC\s13人际亲密感量表Figure6-3:InterpersonalIntimacyScale
如图6-4,被评判恐惧通过5个条目评估,改编自既有量表【1】,内容包括“我担心在演讲中显得很愚蠢”、“我害怕被这个虚拟评委批评”、“我觉得它对我表达出不满”等。图6-SEQ图\*ARABIC\s14被评判恐惧量表Figure6-4:InterpersonalIntimacyScale
用户体验评估(UserExperienceEvaluation),如图5-5,参与者就以下方面对使用智能体进行辅导的体验进行评价:实用性(4题,如“它有助于我更有效地进行演讲练习”);易用性(3题,如“它操作简单”“用户友好”);趣味性(2题,如“使用它很有趣”);整体满意度与继续使用意愿(各1题)。图6-SEQ图\*ARABIC\s15用户体验评估Figure6-5:UserExperienceEvaluation同时,问卷还包含3个开放性问题:
1.你觉得这个虚拟评委在哪些方面对你准备演讲特别有帮助?
2.你觉得哪些方面它不够有用?为什么?
3.如果你能重新设计这个智能体,你会添加或改进哪些功能?
为控制VR临场感对焦虑的影响,参与者被要求使用0–100的评分量表评估自己在虚拟演讲房间中的“临场感”(0=完全不真实,100=完全如同身临其境)BarfieldW,
特质公共演讲焦虑通过6个条目改编自PRCA量表测量,如“演讲时我会感到肌肉紧张”、“我在演讲中感到放松(反向题)”、“我很有信心地面对演讲任务(反向题)”等。
此外,我们还通过一题评估参与者对大语言模型或智能代理系统的使用经验:“过去几个月中,你使用智能代理(如ChatGPT、ERNIEBot等)的频率是?”评分范围为1(从未使用)到7(每天使用)。6.2社交实验具体流程本实验在高校的虚拟现实实验教室中进行,虚拟教室设置模拟真实演讲环境,包括讲台与可容纳虚拟观众的空间。实验旨在评估虚拟智能体评委的反馈与辅导是否能够有效缓解参与者的公众演讲焦虑。研究问题:为了了解虚拟智能体评委的反馈与辅导对缓解参与者的公众演讲焦虑和长期携带效应,我们研究了以下研究问题:RQ1:用户能否利用虚拟智能体评委的反馈与辅导来缓解公众演讲焦虑?RQ2:用户利用虚拟智能体评委对演讲进行反馈与辅导的用户体验如何?RQ3:对演讲焦虑的缓解效果是否可以延续较长时间,例如1周或1个月?鉴于本研究旨在探讨在虚拟现实(VR)环境中,由虚拟智能体评委提供的反馈与辅导是否能够有效缓解公众演讲焦虑,我们特意招募了那些自我报告在公众演讲方面存在困难的参与者。参与者主要来自某综合性大学的本科公共演讲或传播类相关课程。在正式参与前,我们设置了一个预筛选问题,以识别具有中度或高度公众演讲恐惧的个体。具体来说,参与者需就以下陈述进行评分:“我在公众演讲中不会感到焦虑。”评分采用5点李克特量表(1=非常不同意,5=非常同意)。选择得分高于3的学生被排除在外,这表明他们在公众演讲中很少或没有焦虑。最终样本共包括60名参与者(其中女性30人,男性30人),他们自愿参与实验,并以获得课程学分作为回报。参与者的年龄范围为18至30岁之间,平均年龄为24.7岁(标准差为3.8),身份主要为大学在读学生或教职工。所有参与者均报告视力正常或经矫正达到正常水平,且无听力障碍。关于VR经验,所有参与者都表示曾有使用VR的经历。在不同实验条件下,参与者的VR熟悉程度无显著差异。在本次实验正式开启之前,我们向每一位参与者详细介绍了整个实验的流程。参与者们明确知晓,他们将在此次实验中经历两轮公众演讲,并完成相应的问卷填写工作。而且,这两轮演讲都将在一个特殊的环境中进行——在虚拟观众与智能评委面前进行表达。实验起始阶段,参与者首先需要完成一份状态焦虑量表的填写。这份量表的作用至关重要,它将作为衡量参与者在演讲前焦虑水平的基准数据。通过这份量表,我们能够初步了解参与者在面对即将到来的公众演讲时的心理状态。随后,参与者将借助VR头显设备OculusQuestPro进入公众演讲模拟系统。这个系统精心模拟了一个典型的演讲教室场景,力求为参与者营造出尽可能真实的演讲环境。在这个虚拟的演讲教室里,台下设有3个虚拟评委和10个观众。值得一提的是,这些虚拟评委并非简单的程序设定,而是由语言模型驱动的虚拟智能体组成。它们具备强大的自然语言交互能力,能够根据参与者的实际表现进行实时、准确的评估和反馈。当参与者成功进入虚拟场景后,他们将在清晰的语音提示引导下,使用手柄轻松移动至教室中央的讲演区域。在这里,他们将迎来第一轮演讲。演讲的主题为预设话题A,例如:“大学生应不应该用ChatGPT辅助学习?”在开始演讲之前,参与者会获得5分钟的准备时间,以便他们能够充分组织自己的思路和语言。在这5分钟里,参与者可以在虚拟环境中自由思考,为即将到来的演讲做好充分准备。之后,参与者有最多2分钟的时间来完成第一轮演讲。在这2分钟内,他们需要充分展现自己的观点和表达能力,向虚拟评委和观众阐述自己对于话题A的看法。演讲结束后,三位虚拟评委将依次对参与者进行点评。这些点评并非千篇一律,而是依据参与者在演讲过程中的实际表现进行针对性的调整。例如,评委们会关注参与者的语速是否适中、用词是否准确恰当、眼神交流是否自然等多个方面。基于这些观察和分析,评委们会为每一位参与者提供个性化的辅导建议。这个辅导环节预计持续约5分钟,在这5分钟里,参与者能够从评委们的专业点评中获取宝贵的反馈信息,了解自己的优点和不足之处,从而为下一轮演讲做好更充分的准备。完成反馈与辅导后,参与者将再次获得数分钟的准备时间。这段时间里,他们可以根据评委们的建议,对自己的演讲内容和表达方式进行调整和优化。然后,他们将迎来第二轮正式演讲,演讲主题为预设话题B,例如:“是否应该强制大学生上思政课?”在第二轮演讲前,参与者需要再次填写状态焦虑量表。通过与第一轮演讲前的量表数据进行对比,我们可以评估出参与者在经过第一轮演讲和辅导后,其焦虑水平是否发生了变化。在第二轮演讲过程中,虚拟评委不再发言,而是保持专注的凝视与自然的动作,以此营造出一种真实的评判氛围。这种设计旨在让参与者更加专注于自己的演讲内容和表达,而不会受到过多外界因素的干扰。第二轮演讲时长仍为1-2分钟,在这短暂而关键的时间里,参与者需要充分展示自己在经过辅导后的进步和提升。演讲结束后,参与者摘下VR设备,此时他们需要填写第三次状态焦虑量表。这份量表的数据将用于评估参与者在经过整个辅导过程后的焦虑变化情况。通过对这三次量表数据的分析,我们能够深入了解参与者在面对公众演讲时的心理状态变化,以及辅导环节对他们焦虑水平的影响。所有演讲任务结束后,参与者被引导坐回座位,完成一份在线问卷。这份问卷将涵盖多个方面的内容,包括参与者对整个实验过程的感受、对虚拟评委辅导的评价、对自己演讲表现的认知等。通过参与者对问卷的回答,我们能够进一步收集他们的反馈意见,为后续的研究和改进提供有力的支持。整个实验流程预计持续30-40分钟。在这期间,为了减少对参与者的干扰,确保实验数据的准确性和可靠性,实验者将始终保持在参与者的视线之外。这样一来,参与者能够在相对独立和自然的环境中完成实验任务,从而使我们获取到的实验数据更加真实、有效。实验场景如图6-6图6-SEQ图\*ARABIC\s16实验截图Figure6-6:ExperienceScreenshot这项研究涉及参与者被邀请参加为期1周和1个月后的后测试,以检查虚拟智能体评委的反馈与辅导对缓解参与者的公众演讲焦虑是否具有长期携带效应。所有的参与者都在1周后和1个月后进行了后测试。参与者佩戴VR设备在虚拟环境中执行了第二轮预设话题B的演讲,然后填写演讲后的状态焦虑量表和特质焦虑量表。7.实验结果经过数据处理后,最后得到的预期的结果,表7-1显示了测量变量的描述性统计。我们采用配对样本t检验和方差分析研究我们提出的三个研究问题,显著性水平设定为p<0.05图表7-SEQ图表\*ARABIC\s11用户参数问卷设计表Table7-1:Userparameterquestionnairedesignform变量平均值标准差第一轮演讲前焦虑65.5221.12第一轮演讲后焦虑59.8320.85第二轮演讲前焦虑44.6219.63第二轮演讲后焦虑42.4118.70演讲后一周焦虑44.1718.23演讲后一月焦虑46.0517.20第一轮特质焦虑3.480.74第二轮特质焦虑2.330.71演讲后一周特质焦虑2.520.69演讲后一月特质焦虑2.680.65感知社交性3.680.85感知人际亲密度3.490.88害怕被批评1.520.53有用性3.420.77易用性4.300.81使用乐趣3.810.96整体满意度3.870.91继续参加意愿3.501.02虚拟现实沉浸感65.7223.70互动体验5.761.08公共演讲焦虑:图7-SEQ图\*ARABIC\s11演讲前后参与者焦虑状态对比柱状图Figure7-1:ColumnChartComparingParticipants'AnxietyStatesBeforeandAftertheSpeech如图7-1所示,配对样本t检验显示,参与者在第一轮演讲和第二轮演讲前的状态焦虑存在显著差异,第一轮前测为M=65.52,SD=21.12,第二轮前测为44.62,SD=19.63。t(59)=16.07,p<0.001。参与者在第一轮演讲和第二轮演讲后的状态焦虑亦观察到类似趋势,配对样本t检验显示,第一轮后测为M=59.83,SD=20.85,第二轮后测为M=42.41,SD=18.70,t(59)=11.34,p<0.001。关于演讲中的特质焦虑,配对样本t检验显示,参与者在第一轮演讲和第二轮演讲的特质焦虑存在显著差异,第一轮为M=3.48,SD=0.74,第二轮前测为2.33,SD=0.71。t(59)=6.22,p<0.001。这些结果表明,虚拟智能体评委在演讲前后的反馈与辅导对减轻演讲焦虑具有积极作用。关于用户体验,(RQ2),参与者对虚拟智能体评委的整体评价普遍积极。在5分量表下,“实用性”平均得分为M=3.42,SD=0.77,“易用性”为M=4.30,SD=0.81,“趣味性”为M=3.81,SD=0.96,“满意度”为M=3.87,SD=0.91,“未来继续使用意愿”为M=3.50,SD=1.02。此外,参与者普遍认为该虚拟评委具有较高的社会性与亲和感,其中“社交性感知”平均得分为M=3.68,SD=0.85,“人际亲密感”为M=3.49,SD=0.88。这些评分表明,大多数参与者在演讲过程中能够感知到虚拟评委的“拟人化”“可沟通”“友好”等社交特质,并在一定程度上建立了情感联系。值得注意的是,“被评判恐惧”得分较低,平均为M=1.52,SD=0.53,说明多数参与者并未因虚拟评委的存在而感到强烈的批评、否定或羞辱感。相较于现实中的真实评委或观众,这种虚拟智能体环境可能降低了参与者的社交威胁感知,从而间接提升了系统的接受度和使用舒适度。长期携带效应:图7-SEQ图\*ARABIC\s12演讲后状态焦虑Figure7-2:post-speechstateanxiety图7-SEQ图\*ARABIC\s13演讲特质焦虑Figure7-3:speechtraitanxiety为验证虚拟智能体反馈与辅导效果是否具备长期携带效应,我们使用重复测量方差分析(ANOVA)对四个阶段的演讲后状态焦虑进行了检验,分别为第一轮演讲后、第二轮演讲后、一周后和一个月后的追踪测试。如图所示,结果显示阶段主效应显著,F(3,177)=18.26,p<0.001。进一步使用Bonferroni方法进行事后两两比较,结果表明:第二轮演讲后的状态焦虑(M=42.41,SD=18.70)显著低于第一轮演讲后(M=59.83,SD=20.85),p<.001;一周后(M=44.17,SD=18.23)与第二轮后差异不显著(p=0.75);一个月后(M=46.05,SD=17.20)与第二轮后相比仍无显著差异(p=0.42),但与第一轮后相比差异显著(p<0.001)。为进一步检验智能体反馈与辅导对参与者特质焦虑的长期影响,对四个时间点的特质焦虑进行重复测量方差分析,如图所示,结果显示阶段主效应显著,F(3,177)=6.36,p<0.001,表明参与者在不同阶段的特质焦虑水平存在显著差异。进一步使用Bonferroni方法进行事后两两比较,结果表明:第二轮演讲的特质焦虑(M=2.33,SD=0.71)显著低于第一轮演讲(M=3.48,SD=0.74),p<0.001;一周后(M=2.52,SD=0.69)与第二轮差异不显著(p=0.42);一个月后(M=2.68,SD=0.65)与第二轮相比仍无显著差异(p=0.31),但与第一轮相比差异显著(p<0.001)。这些结果表明,虚拟智能体评委的个性化反馈与辅导不仅对即时状态焦虑有效,也在更稳定的个体倾向层面(特质焦虑)上产生了延续性的缓解效应。开放性问答的定性反馈分析:为了进一步理解参与者对虚拟智能体评委在公众演讲训练中的使用体验,我们对三个开放式问题进行了主题分析,分别围绕其有用之处、不足之处以及未来改进建议展开。参与者的反馈揭示了虚拟评委在减缓焦虑、提升体验及存在局限性等方面的多个关键主题。虚拟评委在公众演讲辅导中的有效性:多位参与者表示,虚拟评委在两个方面尤为有帮助:缓解情绪压力和提供建设性反馈。部分参与者提到,与真实人类评委相比,虚拟智能体带来的互动体验更轻松,心理负担更小。其中一位参与者表示:“它很热情,感觉比真人对我的压力更小”。此外,虚拟评委在提供演讲练习机会和有效点评方面也受到好评。有参与者认为系统给予的反馈“中肯”,并表示他们非常欢迎在没有现实社交压力的情境中练习演讲。例如,一位参与者写道:“可以让我练习演讲”;另一位指出:“点评的不错”。虚拟评委的不足之处:尽管整体反馈积极,参与者也指出了虚拟评委存在的若干问题。其中最常被提及的是其缺乏真实感。多位参与者表示,虚拟评委在视觉形象与语音表达方面都不够逼真,难以完全模拟真实的听众或评审场景。例如,一位参与者指出:“形象不够逼真”;另一位补充道:“声音比较僵硬”。对虚拟评委的未来改进建议:在提出改进建议时,参与者表达了若干具有实际意义的想法。其中较为普遍的是希望虚拟评委能更加互动、更加生动,如增加自然动作或扩展交互方式。例如,一位参与者建议:“增加更多动作”;另一位表示:“增加多种交互方式”。同时,部分参与者也强调需要提升系统的逼真度与沉浸感,希望在视觉形象与语音语调方面更贴近真人,提升沉浸式体验。有人简洁地写道:“更真实些”。综合来看,虽然虚拟智能体评委在缓解焦虑和提供初步辅导方面表现出色,但参与者也希望它在未来能够变得更加拟人化、个性化,并能更好地模拟真实公众演讲的紧张情境,以实现更高质量的演讲训练体验。研究结论与系统展望8.1研究结论本研究成功构建了一个基于VR技术的社交焦虑测评平台,通过高度逼真的虚拟环境和智能体的交互,为用户提供了精准且沉浸式的社交焦虑测评体验。实验结果表明,该系统能够有效模拟真实社交场景中的压力环境,从而准确评估被测者的社交焦虑水平通过在公共演讲场景中引入虚拟智能体评委,本研究发现虚拟智能体能够根据被测者的表现提供个性化的反馈与辅导。实验数据显示,参与者在接受虚拟智能体评委的反馈后,其状态焦虑和特质焦虑水平均显著降低。这表明虚拟智能体在缓解社交焦虑方面具有积极作用,能够有效减轻被测者在社交场合中的紧张和不安情绪本研究通过创新性地结合VR技术与社交焦虑测评,验证了虚拟智能体在缓解社交焦虑方面的有效性,为心理健康领域的研究与实践提供了新的思路和方法8.2系统展望综上,本系统已经能很好的验证虚拟智能体能缓解焦虑,对社交焦虑的治疗有一定的效果,但是仍存在一些问题,尽管系统在模拟社交场景方面做出了努力,但虚拟环境和智能体仍缺乏足够真实感。在视觉上,虚拟评委和观众的形象细节不够丰富,动作较为生硬、机械,无法完全展现出真实人类的自然姿态和表情变化;语音方面,语音合成的效果虽然能够满足基本交流需求,但与真实人类的语音相比,语调、语气变化不够自然流畅,难以传递丰富的情感信息,这在一定程度上影响了用户的沉浸感和交互体验。与此同时,目前系统仅采集了眼动信息和主观反馈数据,数据类型相对单一,无法全面反映用户在社交焦虑测评过程中的生理和心理变化。此外,在数据分析方法上,虽然使用了配对样本t检验和方差分析等常见统计方法,但对于复杂的多模态数据融合分析以及挖掘数据背后潜在的规律和关系,现有的分析手段还不够深入和全面,可能会遗漏一些重要信息,影响对社交焦虑测评结果的深入理解和应用。对于系统未来的展望,当前系统仅仅只是对公共演讲场景进行了演讲,在未来,可以进一步拓展多样化的社交场景,如社交聚会、商务洽谈、小组讨论等。针对不同场景的特点和需求,精心设计相应的环境布局、角色设定和互动规则。例如在社交聚会场景中,设置不同性格、身份的虚拟角色,模拟复杂多样的社交互动情境,包括闲聊、游戏、合作任务等环节;在商务洽谈场景中,构建逼真的会议室环境,设定专业的商务谈判流程和虚拟客户角色,让用户在更丰富的场景中进行社交焦虑测评和训练,提高系统的适用性和全面性。并且需要增加生理数据的采集种类,如皮肤电反应、心率变异性等,从多个生理指标综合评估用户在社交场景中的焦虑程度;结合行为数据分析,如用户的肢体动作、语言流畅度等,更全面地捕捉用户的社交行为特征。运用深度学习等前沿数据分析技术,对多源异构数据进行深度融合和挖掘,构建更精准的社交焦虑评估模型,为个性化干预提供更坚实的数据支持和科学依据,推动社交焦虑测评和干预工作向更精准化、智能化方向发展。参考文献[1] NavyaN.Sharan,AlexanderToet,TinaMioch,OmarNiamut,andJanB.F.vanErp.2022.The relativeimportanceofsocialcuesinimmersivemediatedcommunication.InHumanInteraction, EmergingTechnologiesandFutureSystemsV:Proceedingsofthe5thInternationalVirtual ConferenceonHumanInteractionandEmergingTechnologies,IHIET2021,August27-29,2021and the6thIHIET:FutureSystems(IHIET-FS2021),October28-30,2021,France.Springer,491–498.[2] Toni-LeeSterleyandJaideepS.Bains.2022.Socialcommunicationofaffectivestates.Current OpinioninNeurobiology68(2022),44–51./10.1016/j.neuroscience.2022.08.022[3] EdwardT.Hall,RayL.Birdwhistell,BernhardBock,PaulBohannan,A.RichardDieboldJr, MarshallDurbin,MunroS.Edmonson,J.L.Fischer,DellHymes,andSolonT.Kimball.1968. Proxemics[andcommentsandreplies].Currentanthropology9,2/3(1968),83–108. /10.1086/200975[4] DSMTFAmericanPsychiatricAssociation,AmericanPsychiatricAssociation,etal.2013.Diagnostic andstatisticalmanualofmentaldisorders:DSM-5.Vol.5.Americanpsychiatricassociation Washington,DC.[5] SandraL.Baker,NinaHeinrichs,Hyo-JinKim,andStefanG.Hofmann.2002.TheLiebowitzsocial anxietyscaleasaself-reportinstrument:apreliminarypsychometricanalysis.Behaviourresearchand therapy40,6(2002),701–715./10.1016/s0005-7967(01)00060-2[6] D.M.Fresco,M.E.Coles,RichardG.Heimberg,M.R.Liebowitz,S.Hami,MurrayB.Stein,andD.Goetz.2001.TheLiebowitzSocialAnxietyScale:acomparisonofthe psychometricpropertiesofself-reportandclinicianadministeredformats.Psychologicalmedicine31, 6(2001),1025–1035.https:///10.1017/s0033291701004056[7] SaniyeTugbaBulu.2012.Placepresence,socialpresence,co-presence,andsatisfactioninvirtual worlds.Computers&Education58,1(2012),154–161./10.1016/pedu.2011.08.024[8] PaulM.G.Emmelkamp,KatharinaMeyerbröker,andNexhmedinMorina.2020.Virtualreality therapyinsocialanxietydisorder.CurrentPsychiatryReports22,7(2020),32. /10.1007/s11920-020-01156-1[10] JeremyN.Bailenson,JimBlascovich,AndrewC.Beall,andJackM.Loomis.2001.Equilibrium theoryrevisited:Mutualgazeandpersonalspaceinvirtualenvironments.Presence:Teleoperators& VirtualEnvironments10,6(2001),583–598./10.1162/105474601753272844[11] JeremyN.Bailenson,JimBlascovich,AndrewC.Beall,andJackM.Loomis.2003.Interpersonal distanceinimmersivevirtualenvironments.Personalityandsocialpsychologybulletin29,7(2003), 819–833./10.1177/0146167203029007002[12] JustineCassell,TimothyBickmore,MarkBillinghurst,LeeCampbell,KennyChang,Hannes Vilhjálmsson,andHaoYan.1999.Embodimentinconversationalinterfaces:Rea.InProceedingsof theSIGCHIconferenceonHumanFactorsinComputingSystems.AssociationforComputing Machinery,520––527.https:///10.1145/302979.303150[13] SeanAndrist,MichaelGleicher,andBilgeMutlu.2017.Lookingcoordinated:Bidirectionalgaze mechanismsforcollaborativeinteractionwithvirtualcharacters.InProceedingsofthe2017CHIc onferenceonhumanfactorsincomputingsystems.ACMPress,2571–2582. /10.1145/3025453.3026033[14] SeanAndrist,TomislavPejsa,BilgeMutlu,andMichaelGleicher.2012.DesigningEffectiveGaze MechanismsforVirtualAgents.InProceedingsoftheSIGCHIConferenceonHumanFactorsin ComputingSystems.AssociationforComputingMachinery,705—-714. /10.1145/2207676.2207777[15] MartinJohannesDechant,JulianFrommel,andReganMandryk.2021.Assessingsocialanxiety throughdigitalbiomarkersembeddedinagamingtask.InProceedingsofthe2021CHIConference onHumanFactorsinComputingSystems.AssociationforComputingMachinery,1–15. /10.1145/3411764.3445238[16] MartinDechant,SabineTrimpl,ChristianWolff,AndreasMühlberger,andYoussefShiban.2017. Potentialofvirtualrealityasadiagnostictoolforsocialanxiety:Apilotstudy.ComputersinHuman Behavior76(2017),128–134./10.1016/j.chb.2017.07.005[17] MartinJohannesDechant,MaxV.Birk,YoussefShiban,KnutSchnell,andReganL.Mandryk.2021. HowAvatarCustomizationAffectsFearinaGameBasedDigitalExposureTaskforSocialAnxiety. ProceedingsoftheACMonHuman-ComputerInteraction5,ChiPlay(2021), 1–27./10.1145/3474675[18] MikeAllen,JohnEHunter,andWilliamADonohue.1989.Meta-analysisofself-reportdataonthe Paper434Page10CHI2020PaperCHI2020,April25–30,2020,Honolulu,HI,USAeffectivenessof publicspeakinganxietytreatmenttechniques.CommunicationEducation38,1(1989),54–76.[19] EmmanuelAyedoun,YukiHayashi,andKazuhisaSeta.2015.Aconversationalagenttoencourage willingnesstocommunicateinthecontextofEnglishasaforeignlanguage.ProcediaComputer Science60(2015),1433–1442.[20] TheoAraujo.2018.Livinguptothechatbothype:Theinfluenceofanthropomorphicdesigncuesand communicativeagencyframingonconversationalagentandcompanyperceptions.Computersin HumanBehavior85(2018),183–189.[21] MargalitBar-Zvi.2011.Virtualrealityexposureversuscognitiverestructuringfortreatmentofpublic speakinganxiety:Apilotstudy.TheIsraeljournalofpsychiatryandrelatedsciences48,2(2011),91.[22] AmyMBippusandJohnADaly.1999.Whatdopeoplethinkcausesstagefright?:Naïveattributions aboutthereasonsforpublicspeakinganxiety.CommunicationEducation48,1(1999),63–72.[23] SaraswathiBellurandSShyamSundar.2017.Talkinghealthwithamachine:Howdoesmessage interactivityaffectattitudesandcognitions?HumanCommunicationResearch43,1(2017),25–53.[24]Asakura,S.(2012).Socialanxietydisorder:currentstatusandfuturedirections.[25]Caballo,V.E.,&Salazar,I.C.(2022).IntroductionCurrentstatusofresearchonsocialanxietyand relationshipwithpsychoeducationalvariables:Aninternationalperspective.EuropeanJournalof EducationandPsychology,15(2),3-6.doi:10.32457/ejep.v15i2.1966[26]张逸飞,陈俊文,Turel,O.,&何清华.(2022).Fromfearsofevaluationtosocialanxiety:The longitudinalrelationshipsandneuralbasisinhealthyyoungadults.InternationalJournalofClinical andHealthPsychology,22(3),100284.[27] LiuZ,JiangE,ZhuZ,etal.ClassMeta:DesigningInteractiveVirtualClassmatetoPromoteVR ClassroomParticipation[C]//ProceedingsoftheCHIConferenceonHumanFactorsinComputing Systems.2024:1-17.[28] Meng-YunLiao,Ching-YingSung,Hao-ChuanWang,etal.Virtualclassmates:Embodying historicallearners’messagesaslearningcompanionsinaVRclassroomthroughcomment mapping[C]//2019IEEEConferenceonVirtualRealityand3DUserInterfaces(VR).IEEE,2019: 163-171.
[29]HongGao,EfeBozkir,LisaHasenbein,etal.Digitaltransformationsofclassroomsinvirtua
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 村级饮水设施维修服务合同二篇
- 诊所护理不良事件:风险评估
- 2026年AI合作软件开发合同
- 2026年度全方位暖通工程协议书
- 2026年互联网检测托管运营合同
- 酒店客房智能音箱拾音器防窃听每季度白噪声屏蔽测试安全防范措施
- 可注射骨水泥的力学性能与生物相容性结题报告
- 基于信念传播的分布式学习结题报告
- 2026年全国施工员之装修施工基础知识考试核心强化题(附答案)
- 慢阻肺急性发作期护理工具应用
- 2026广东广州市海珠区社区专职工作人员招聘23人考试备考题库及答案解析
- 期末复习课件2025-2026学年统编版八年级历史下册
- GB/T 11765-2026油茶籽油
- 2026河北邯郸市劳动就业服务局招聘公益性岗位人员考试参考题库及答案解析
- 2025四川省成都市中考物理试题(解析版)
- 2026年哈三中高三下学期三模数学试卷及答案
- 安徽省检察院书记员笔试真题
- 2026年人工智能训练师(三级)职业技能鉴定理论考试题库(含答案)
- 卫生管理(副高)高级职称考试题库及答案
- 医院教育委员会工作制度
- 高压开关柜生产工艺及质量标准
评论
0/150
提交评论