2025QECon全球软件质量效能大会:多模态图像生成与质量评价_第1页
2025QECon全球软件质量效能大会:多模态图像生成与质量评价_第2页
2025QECon全球软件质量效能大会:多模态图像生成与质量评价_第3页
2025QECon全球软件质量效能大会:多模态图像生成与质量评价_第4页
2025QECon全球软件质量效能大会:多模态图像生成与质量评价_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

刘笑宏|上海交通大学副教授、上海创智学院全时导师个人介绍个人介绍•2018.01–2021.11加拿大麦克马斯特大学博士•2022.01–2024.12上海交通大学助理教授•2025.01–至今上海交通大学副教授•2025.08–至今上海创智学院全时导师成果简述:研究方向为计算机视觉,多媒体信息处理。现已发表国际顶级会议与期刊论文100+CVPR/ICCV/ECCV/NeurIPS上共发表论文23篇,并获得ACMMM’24最佳论文奖提名科研项目:主持国自然青年基金、四川省青年基金、“交大之星”医工交叉研究基金青年项目,承担华为、腾讯、美团、OPPO等企业委托的技术研发项目,并参与国自然重点项目荣誉获奖:入选2022年上海市领军人才(海外)、上海市浦江人才,获得2023年华为难题揭榜火花奖、2024年微软亚洲研究院铸星计划(全球17人)、2025年世界人工智能大会璀璨明星提名奖学术服务:现担任上海市计算机学会计算机视觉专委会副秘书长、CSIG青年工作委员会委员个人主页:/~xiaohongliu/2223322335QiQin,LeZhuo,YiXin,RuoyiDu,ZhenLi,BinFu,YitingLu,JiakangYuan,XinyueLi,DongyangLiu,XiangyangZhu,ManyuanZhang,WillBeddow,ErwannMillon,VictorPerez,WenhaiWang,ConghuiHe,BoZhang,XiaohongLiu,HongshengLi,YuQiao,ChangXu,PengGao.Lumina-Image2.0:AUnifiedandEfficientImageGenerativeFramework,ICCV2025.5QiQin,QiQin,LeZhuo,YiXin,RuoyiDu,ZhenLi,BinFu,YitingLu,JiakangYuan,XinyueLi,DongyangLiu,XiangyangZhu,ManyuanZhang,WillBeddow,ErwannMillon,VictorPerez,WenhaiWang,ConghuiHe,BoZhang,XiaohongLiu,HongshengLi,YuQiao,ChangXu,PengGao.Lumina-Image2.0:AUnifiedandEfficientImageGenerativeFramework,ICCV2025.6Lumina.mGPT2.0:基于自回归模型YiXin,JunchengYan,QiQin,ZhenLumina.mGPT2.0:基于自回归模型YiXin,JunchengYan,QiQin,ZhenLi,DongyangLiu,ShichengLi,VictorShea-JayHuang,YupengZhou,RenruiZhang,LeZhuo,TianchengHan,XiaoqingSun,SiqiLuo,MengmengWang,BinFu,YuewenCao,HongshengLi,GuangtaoZhai,XiaohongLiu,YuQiao,PengGao.Lumina-mGPT2.0:Stand-AloneAutoRegressiveImageModeling,SubmittedtoTPAMI.7Lumina.mGPT2.0:基于自回归模型YiXin,JunchengYan,QiQin,ZhenLumina.mGPT2.0:基于自回归模型YiXin,JunchengYan,QiQin,ZhenLi,DongyangLiu,ShichengLi,VictorShea-JayHuang,YupengZhou,RenruiZhang,LeZhuo,TianchengHan,XiaoqingSun,SiqiLuo,MengmengWang,BinFu,YuewenCao,HongshengLi,GuangtaoZhai,XiaohongLiu,YuQiao,PengGao.Lumina-mGPT2.0:Stand-AloneAutoRegressiveImageModeling,SubmittedtoTPAMI.89YiXin,JunchengYan,QiQin,ZhenLi,DongyangLiu,ShichengLi,VictorShea-JayHuang,YupengZhou,RenruiZhang,LeZhuo,TianchengHan,XiaoqingSun,SiqiLuo,MengmengWang,BinFu,YuewenCao,HongshengLi,GuangtaoZhai,XiaohongLiu,YuQiao,PengGao.Lumina-mGPT2.0:Stand-AloneAutoRegressiveImageModeling,SubmittedtoTPAMI.9Lumina.mGPT2.0:基于自回归模型YiXin,JunchengYan,QiQin,ZhenLumina.mGPT2.0:基于自回归模型YiXin,JunchengYan,QiQin,ZhenLi,DongyangLiu,ShichengLi,VictorShea-JayHuang,YupengZhou,RenruiZhang,LeZhuo,TianchengHan,XiaoqingSun,SiqiLuo,MengmengWang,BinFu,YuewenCao,HongshengLi,GuangtaoZhai,XiaohongLiu,YuQiao,PengGao.Lumina-mGPT2.0:Stand-AloneAutoRegressiveImageModeling,SubmittedtoTPAMI.2233多物体图像编辑中的数量感知学习待编辑图混叠现象Threerabbitsandtwofoxes“bears”多物体图像编辑中的数量感知学习多物体图像编辑中的数量感知学习多物体图像编辑中的数量感知学习多物体视频生成现有问题l现有视频生成模型的问题有如下两个挑战:配runningonthegrasslandl解决思路:层次化生成(LayerGeneration视频生成的全新思路层次化视频生成方案层次化视频生成方案l支持迭代生成l生成视频高度和谐(影子/倒影等)l更多控制结果美学二维码生成••二维码作为连接真实世界与数字世界的重要桥梁,现已被广泛使用。然而,现有黑二维码基础Text2QR:文生美学二维码算法框架Text2QR:文生美学二维码算法框架Text2QR:文生美学二维码Text2QR:文生美学二维码标识符损失(MarkerLoss,ℒm)和谐度损失(HarmonizingLoss,ℒh)OptimizerOptimizerVZ&DVI&(Unscannable)EQ\*jc3\*hps22\o\al(\s\up1(人),I&)(Unscannable)Q(Scannable)ObjectivefunctionLLmLcLhBlueprintText2QR:文生美学二维码Text2QR:文生美学二维码Text2QR:文生美学二维码Text2QR:文生美学二维码Face2QR:图生美学二维码Face2QR:图生美学二维码Face2QR:图生美学二维码Face2QR:图生美学二维码基于生成式感知先验的低光图像增强•利用多模态大模型从多个方面评价低光照图像的视觉质量,输出全局和局部的感知先验•以视觉质量评价结果为依据,对不同区域进行针对性增强,初步实现了LLIE-Agent概念•算法性能较为鲁棒,在真实低光照数据集上效果较好基于生成式感知先验的低光图像增强基于生成式感知先验的低光图像增强基于生成式感知先验的低光图像增强2233A-bench:大模型生成内容质量评价能力的基准测试••测试现有多模态大模型在生成视觉内容质量评价方面的能力•通过建立多维度基准测试方法,推动多模态评价大模型的发展A-bench:大模型生成内容质量评价能力的基准测试••通过构建数据明确大模型是否具备与质量评价任务相关的核心能力:1.高层图像语义理解能力(图文对齐、复杂概念识别等)2.低层图像质量感知能力(技术失真、生成失真、风格等)A-bench:大模型生成内容质量评价能力的基准测试••语义理解部分包括:基础识别能力(BasicRecognition)、特殊知识理解能力(OutsideKnowledgeRealization)、复杂语义识别能力(PitfallsDiscrimination)基础识别能力基础识别能力特殊知识理解能力特殊知识理解能力A-bench:大模型生成内容质量评价能力的基准测试••语义理解部分包括:基础识别能力(BasicRecognition)、特殊知识理解能力(OutsideKnowledgeRealization)、复杂语义识别能力(PitfallsDiscrimination)复杂语义识别能力复杂语义识别能力A-bench:大模型生成内容质量评价能力的基准测试••质量感知部分包括:技术质量感知(TechnicalQualityPerception)、美学质量感知(AestheticQualityEvaluation)、生成失真感知(GenerativeDistortionAssessment)技术质量感知美学质量感知A-bench:大模型生成内容质量评价能力的基准测试•反映出未经微调的多模态大模型并非是生成视觉内容评价的专家•反映出未经微调的多模态大模型并非是生成视觉内容评价的专家,目前与人类感知仍存在显著差距,且对不同失真维度的评价鲁棒性不高。Q-Eval-100K:生成图像自动化评测•大规模AIGC质量评价数据集还未建立,质量评价的规模定律未被探究最大的MOS评分标注数据集Q-Eval-100K,可用于建立AIGC视觉感知质量与图文一致性评

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论