互联网视频开放协议

开放协议概述

使用此开放协议,将会为您的网站带去更多流量!

        《互联网视频开放协议》是百度视频搜索制定的搜索引擎视频源收录标准,网站可将发布的视频内容制作成遵循此开放协议的XML格式的网页(独立于原有的视频发布形式)供搜索引擎索引,将网站发布的视频主动、及时地告知百度搜索引擎。

        采用了《互联网视频开放协议》,就相当于网站的视频被搜索引擎订阅,通过百度--全球最大的中文视频搜索引擎这个平台,网民将有可能在更大范围内更高频率地访问到您网站的视频,进而为您的网站带来潜在的流量。

开放协议非常简单! 您可以在我们的帮助下轻松使用。

开放协议内容

        下图为遵照《互联网视频开放协议》制作的XML格式的网页,网页上按照标准格式列出了网站发布的视频的相关信息。
XML网页示例:

XML标签说明: 其中带星号标记的为必选项,未带星号标记为可选项。
*<document>——标记整个XML文件内容的开始和结束。
*<webSite>——站点地址。
*<webMaster>——负责人员的Email。当有必要时,我们通过这个地址与您联系。
*<updatePeri>——更新周期,以分钟为单位。搜索引擎将遵照此周期访问该页面,使页面上的视频更及时地出现在百度视频中。协议中只是一个参考值,百度视频搜索会参考这个值定期地检查您所提供的xml文件是否改变,检查改变的方法是通过发送HEAD请求检查xml文件的Last-Modified或Content-Length是否改变,来决定是否进行抓取。所以请务必确认您的服务器能返回Last-Modified或Content-Length其中一项,并且其值会根据您的xml文件的改变而改变。
*<item>——标记每个视频信息的开始和结束。标记内为单个视频信息,不包括视频专题。
*<op>——标记视频信息的操作类型,为add表示添加,为del表示删除。
*<title>——视频标题(当op为del时也可不提供)。
*<playLink>——视频播放所在页面url地址。
<imageLink>——视频缩略图的url地址。
<videoLink>——视频内容的url地址。
<tag>——视频分类信息。
<comment>——视频注释信息。
<duration>——视频播放时间。以秒为单位。
<pubDate>——视频发布时间,与该视频播放页面上的发布时间保持一致。请精确到分钟;若您网站的发布时间未记录小时分钟,提供年月日即可。

推荐时间格式:年月日小时分钟秒
如:2005-11-09 10:37  |  2005/11/09 10:37:00  |  2005.11.09 10:37:00  |
       2005年11月09日10时37分00秒  |  Fri, 09 Nov 2005 10:37:00 GMT


开放协议使用

使用之前您需要了解以下几点:

  • 无论您的网站已经成为百度视频源,还是尚未被百度视频搜索收录,都可以使用此开放协议。
  • 您使用开放协议提供的内容应全部符合下面《视频源收录标准》。
  • 《互联网视频开放协议》只是原始视频源收录方式的一种协助和有益补充,而不是完全取代。

视频源收录标准:
        百度希望视频源多样化,鼓励原创视频内容。如果是具有大量有价值的视频内容并能及时更新的正规、合法的网站,且网站服务器稳定、高速,就符合了百度收录视频源的基本原则。
        百度视频搜索收录任何类型的视频,不过您应对提供的全部内容承担一切法律责任,保证您提供内容的真实性、合法性,并不得侵犯任何第三方的权益。
        XML文件的最小更新周期为5分钟,小于5分钟,百度视频搜索将不能保证能及时获取你更新的数据。
        XML文件的大小最大为10M,大于10M的文件百度视频搜索将不能保证正确获取。
        XML文件提供的视频数据请保证至多是最近7天内的数据,对于7天前的数据百度视频搜索将不予抓取。如站点想提供7天前的数据,则需要联系我们,同时提供另一个临时URL地址,让百度视频搜索访问获取,这个临时地址的XML文件不受10M大小限制,但不可超过2G。如果文件较大,建议分为多个文件,并提供多个URL地址。

下面就开始吧!
第一步:创建XML文件
        请按照上面公布的开放协议内容制作XML文件。

    其它说明:
  • 支持的编码格式有GB18030、UTF-8、GB2312、BIG5等,推荐使用GB18030和UTF-8。注意:XML文件头部的encoding值必须与XML文件的实际编码类型一致。
  • 您可以将网站某一时间段发布的全部视频放在一个XML文件中,也可以分频道或栏目放在多个XML文件中。
  • 网站审批未通过的视频,或者用户设为私有的视频,不建议进行提交。如果已经提交,建议通过DEL标记进行删除。
  • 请保持每个XML文件处于按更新周期持续自动更新状态。
  • XML标签内容中的一些特殊字符需要转换为XML定义的转义字符,否则将发生错误导致搜索引擎不能获取页面上的视频,具体参见下表。如不想转义,则必须使用CDATA标记内容,如"XML网页示例"所示。
    字符转义后的字符
    HTML字符字符编码
    和(and)&&amp;&#38;
    单引号'&apos;&#39;
    双引号"&quot;&#34;
    大于号>&gt;&#62;
    小于号<&lt;&#60;
      转义字符中的"&"无需再转。

第二步:验证XML文件
        可以采用xmlspy或firefox对XML文件进行验证。更多验证工具,可参见下面地址:
        http://www.w3.org/XML/Schema#Tools
        http://www.xml.com/pub/a/2000/12/13/schematools.html
        通过验证的XML文件能够使您提供的信息更加标准,确保您发布的视频信息不被搜索引擎遗漏。

第三步:提交XML网址
        提交前请将XML文件上传到您的网站服务器,将XML文件的URL地址及其它信息输入下面对应的方框内。搜索引擎将定向访问该URL地址,当URL地址发生变化时需要重新提交。
        百度视频搜索将对您提交的数据进行测试和观察一段时间,若您基本按照 《互联网视频开放协议》的要求进行制作但存在问题,我们会根据XML页面上提供的邮件地址与您联系。
        注意: 百度视频搜索不保证一定能收录您提交的全部内容。

*站点名、地址为必填项。
站点名               地址
 
:百度             http://video.baidu.com/video.xml

备注

有需要时填写,并将内容控制在200字以内。



常见问题解答
*《互联网视频开放协议》以下简称《视频开放协议》
我的网站适合使用《视频开放协议》吗?
        如果您的网站符合百度《视频源收录标准》 ,就可以使用《视频开放协议》。
网站的所有频道或栏目都可以被收录吗?
        只要该频道或栏目下的内容页是正常的视频播放页,并且您已按照《视频开放协议》正确提供XML文件,而且通过了我们的测试和观察,就可以被收录。
        如果频道和栏目内容过多,请注意文件大小的限制,建议拆分成多个XML进行提交。
使用《视频开放协议》会影响我原来的视频页面设计与发布吗?
        完全没有影响。这个页面完全不干扰HTML视频页面,也不需要有链接链到这个地址,不需要展现给普通用户。
使用《视频开放协议》后期要大量人力进行维护吗?
        不需要。您只需要进行一次开发,实现自动输出和自动更新。
我的网站已经提供RSS输出,可以直接提交RSS订阅地址吗?
        为了保证您网站的视频能够快速、准确地被百度视频搜索收录,请您严格遵照《视频开放协议》的各项要求创建XML文件,包括数据格式和数据内容,否则无法成功收录。
        RSS订阅地址以及其它不符合《视频开放协议》数据格式要求的XML地址不适合提交。
我的网站每天发布大量视频,需要把全部视频都按照一定格式放在XML页面上吗?
        不需要。您只需要将最近一个更新周期内发布的视频信息逐个罗列在XML页面上,更新周期由您在<updatePeri>标签中设定。假设更新周期为30分钟,您最少可以提供最近30分钟内发布的视频,最多可以提供最近7天内的数据。
如何理解“自动更新”?什么时候需要重新提交XML地址?
        百度视频搜索的程序定周期定向地访问您提供的XML地址,这个周期由您在<updatePeri>标签中设定,百度视频搜索会参考这个值定期地检查您所提供的xml文件是否改变,检查改变的方法是通过发送HEAD请求检查xml文件的Last-Modified或Content-Length是否改变,来决定是否进行抓取。所以请务必确认您的服务器能返回Last-Modified或Content-Length其中一项,并且其值会根据您的xml文件的改变而改变。
        因此,您应提供固定的XML地址,而地址上的内容按照更新周期持续更新,若无法更新将失去被收录的意义。
        当您需要改变XML文件的路径或名称时,请重新提交更改后的XML地址。
一个站点可以提交多个不同的XML地址吗?
        可以。您可以将网站某一时间段发布的全部视频放在一个XML文件中,提交一个XML地址;也可以分频道或栏目放在多个XML文件中,提交多个XML地址。
        但一个XML地址上的视频只能来源于同一个站点。
哪些要求容易被我忽略,而导致全部或部分视频收录失败?
        1.<title>和<text>标签中必须提供完整的相关内容,请不要省略部分内容,也不要增加与该篇视频不相关的内容。
        2.<title>和<text>标签中必须仅仅是表达视频内容的文字文本(XML转义符除外),请不要加入任何HTML语言。
        3.标签中的所有内容如URL、标题、视频链接等,若包含以下特殊符号如“&”“<”“>”等,需要根据XML规范进行转义或用CDATA标记;这些特殊符号仅针对半角符号而言,全角符号无需进行转义。
        4.字符编码必须严格符合XML声明中的规范,例如XML声明为<?xml version="1.0" encoding="GB2312" ?>,若不完全是标准GB2312规范的编码,会导致部分数据丢失。
提交之后,我如何知道网站是否被成功收录?
        百度视频搜索将对您提供的数据进行测试和观察一周。
        若您基本按照《视频开放协议》的标准进行制作但存在问题,我们会根据XML页面上提供的邮件地址与您联系,因此请保证邮件地址真实有效。
        若测试一周后没有任何问题,将会在一至两天内开始正式收录,这时您可以在百度视频搜索框内输入“site:网站域名”查看收录的来自您网站的视频信息。
我还有其它的问题怎么办?
        如果您还有其它疑问或建议,请联系我们




©2009 Baidu