CN113935286B makdown文档转换方法、装置、设备和存储介质 (陕西天元云智信息科技有限公司)_第1页
CN113935286B makdown文档转换方法、装置、设备和存储介质 (陕西天元云智信息科技有限公司)_第2页
CN113935286B makdown文档转换方法、装置、设备和存储介质 (陕西天元云智信息科技有限公司)_第3页
CN113935286B makdown文档转换方法、装置、设备和存储介质 (陕西天元云智信息科技有限公司)_第4页
CN113935286B makdown文档转换方法、装置、设备和存储介质 (陕西天元云智信息科技有限公司)_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

质本发明实施例公开了一种makdown文档转换片的初始图片统一资源定位符并存储至图片信文档数据中的每个初始图片统一资源定位符替2获取待整理文档的文档统一资源定位符,并以所述文档统一资源定位符为输入参数,片的初始图片统一资源定位符,并将各所述初始图片统一资源定位符存储至图片信息集遍历所述图片信息集合,以图片下载函数、当前遍历的所述初始图片统一资源定位符替换为相应的目标图片统一资源定位符,完成makdown文档转换,其中,所述目标图片统一资源定位符是将相应初始图片统一资源定位符对应的图片转存至makdown服务器而获得的新的图片统一资基于所述正则匹配变量,调用字符串匹配函数,对所述文档数据若所述图片下载函数的输入参数中的初始图片统一资源定位符若所述图片数据流不为空,则调用文件写入函数,将所述图片3依据所述图片基础路径信息、所述图片名称信息和图片后缀信息,若基于所述图片文件,判断本地缓存空间中存在所述图片文件述文档数据中的每个所述初始图片统一资源定位符替换为相应的目标图片统一资源定位针对所述量表对象中的每个所述初始图片统一资源定位符,若确获得所述初始图片统一资源定位符对应的目标图片统一资源将所述初始图片统一资源定位符对应的图片文件上传至所述makdown服务器,以使所接收所述makdown服务器返回的存储所述图片文件的新的图片统一资源定位符,作为文档数据获得模块,用于获取待整理文档的文档统一资源定当前遍历的所述初始图片统一资源定位符和所述文档数据作为函数参数传入所述图片下中的每个所述初始图片统一资源定位符替换为相应的目标图片统一资源定位符,完成4对应的图片转存至makdown服务器而获得的新的图片统现如权利要求1_7中任一所述的makdow执行时实现如权利要求1_7中任一所述的makdo5加准确且快速地将待整理的文档数据转换为具有文本格makdown服务器而获得的新的图片统一资6的所述初始图片统一资源定位符和所述文档数据为输入参数,调用图片下载任务生成函对应的图片转存至makdown服务器而获得的新的图片统一资器实现本发明任意实施例所提供的makdo程序,该计算机程序被处理器执行时实现本发明任意实施例所提供的makdown文档转换方当前遍历的初始图片统一资源定位符和文档数据为输入参数,调用图片下载任务生成函数,将当前遍历的初始图片统一资源定位符和文档数据作为函数参数传入图片下载函数,符是将相应初始图片统一资源定位符对应的图片转存至makdown服务器而获得的新的图片的的[0024]图2是本发明实施例二中的一种makdown文档转换方法中图片下载和图片转换7[0029]本实施例提供的makdown文档转换方法,可适用于将包含图片的网页文章自动转档统一资源定位符(UniformResourceLocator,URL)是指待整理文档对应的网页的网络URL(如article_url)为函数输入参数,调用文档下载函数_down_article(),即_down_[0034]其中,图片链接获取函数是指获取待整理文档中的图片函数get_img_list_from_article_file()。该函数的作用是从文档数据中寻找并提取待储至图片信息集合match_list中。函数调用的代码可以示例为:match_list=get_img_list_from_article_fi8据makdown中的图片标签信息定义正则匹配变量;基于正则匹配变量,调用字符串匹配函调用字符串匹配函数,如match_list=pile(MD_IMG_PATTEN).findall(f.read的过程中,首先要根据图片信息集合中的各个初始图片URL来构建相应的图片下载任务对关步骤。然后,在match_list有效的情况下,通过for循环语句(如forimage_urlinmatch_list)来遍历图片信息集合match_list中的每个初始图片U9(_download_image,image_url[i],article_file)。图片下载任务生成函数内部会异步地将该初始图片URL(image_url[i])和文档数据article_file作为函数输入参数,传递至图片下载函数_download_image,获得一个带参数的图片下载函数,作为图片下载任务对象每一个初始图片URL均执行上述循环体内部操作,便可生成一个包含了所有图片的图片下务对象,此时,以下载任务集合g_img_task_list为输入参数,调用携程启动任务函数gevent.joinall(),即gevent.joinall(g_img_task_list)。通过携程启动任务函数参数的图片下载函数_download_image(image_url,article_file),通过各个图片下载函应的图片转存至makdown服务器而获得的新的图的初始图片URL。当所有的图片URL替换完成后,便将待整理文档完整地转换为makdown文[0052]需要说明的是,S110~S150的整个流程可以封装至一个函数,例如defget_article(article_url)。该函数get_article()以待整理文档的文档URL(article_url源定位符是将相应初始图片统一资源定位符对应的图片转存至makdown服务器而获得的新的图片统一资源定位符。实现了将一篇网页文章自动转换为具有一定文本格式的makdown数中的初始图片URL(image_url)来进行是否有效的判定。如果image_url为空,则直接返生成能够唯一表征该初始图片URL对应图片始图片URL(image_url)为输入函数,调用图片名称获取函数,代码示例为:os.searticle_file_image_path(article_file)+os.sep+get_name_from_url(img_url)+"[0066]具体地,以上述初始图片URL(image_url)为输入参数,调用图片获取函数url的网络地址中通过get请求来获取图片的数据流信息(即图片数据流),并标记为img_image_list))方法将image_list列表转换成一个量表gro成文档数据中初始图片统一资源定位符对应的图片说明该初始图片URL是一个http类型的网络图片的真实信息。此时,以文档数据article_file和初始图片统一资源定位符image_url为输入参数,调用图片链接转换函数image_用图片链接替换函数post.replace(),将文档数据article_file中的image_url替换为的新的图片URL便为该初始图片URL对应的目标图片的服务器中获得相应初始图片统一资源定位符对应的图片数据流;若图片数据流不为空,[0081]图片信息集合生成模块320,用于以文档数据为输入参数,调用图片链接获取函中的每个初始图片统一资源定位符替换为相应的目标图片统一资源定位符,完成makdown转存至makdown服务器而获得的新的图片下方式实现将文档数据中的每个初始图片统一资源定位符替换为相应的目标图片统一资初始图片统一资源定位符和目标图片统一资源定位符为输入参数,调用图片链接替换函数据中初始图片统一资源定位符对应的图片[0103]接收makdown服务器返回的存储图片文件的新的图片统一资源定位符,作为目标[0104]通过本发明实施例三的一种makdown文档转换装置,实现了将一篇网页文章自动[0105]本发明实施例所提供的makdown文档转换装置可执行本发明任意实施例所提供的[0109]获取待整理文档的文档统一资源定位符,并以文档统一片统一资源定位符是将相应初始图片统一资源定位符对应的图片转存至makdown服务器而[0118]电子设备400典型地包括多种计算机系统可读介质。这些介质可以是任何能够被[0119]存储装置410可以包括易失性存储器形式的计算机系统可读介质,例如随机存取415通常执行本发明所描述的任意实施例中的以通过网络适配器440与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网[0125]获取待整理文档的文档统一资源定位符,并以文档统一片统一资源定位符是将相应初始图片统一资源定位符对应的图片转存至makdown服务器而可执行指令不限于如上的方法操作,还可以执行本发明任意实施例所提供的makdown文档[0132]计算机可读的信号介质可以包括在基带中或者作为载波[0134]可以以一种或多种程序设计语言

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论