zolfa
/
youtube-dl

import re
from .common import InfoExtractorfrom ..utils import (    find_xpath_attr,    fix_xml_ampersands)

class ClipsyndicateIE(InfoExtractor):    _VALID_URL = r'http://www\.clipsyndicate\.com/video/play(list/\d+)?/(?P<id>\d+)'
    _TEST = {        u'url': u'http://www.clipsyndicate.com/video/play/4629301/brick_briscoe',        u'md5': u'4d7d549451bad625e0ff3d7bd56d776c',        u'info_dict': {            u'id': u'4629301',            u'ext': u'mp4',            u'title': u'Brick Briscoe',            u'duration': 612,        },    }
    def _real_extract(self, url):        mobj = re.match(self._VALID_URL, url)        video_id = mobj.group('id')        js_player = self._download_webpage(            'http://eplayer.clipsyndicate.com/embed/player.js?va_id=%s' % video_id,            video_id, u'Downlaoding player')        # it includes a required token        flvars = self._search_regex(r'flvars: "(.*?)"', js_player, u'flvars')
        pdoc = self._download_xml(            'http://eplayer.clipsyndicate.com/osmf/playlist?%s' % flvars,            video_id, u'Downloading video info',            transform_source=fix_xml_ampersands)
        track_doc = pdoc.find('trackList/track')        def find_param(name):            node = find_xpath_attr(track_doc, './/param', 'name', name)            if node is not None:                return node.attrib['value']
        return {            'id': video_id,            'title': find_param('title'),            'url': track_doc.find('location').text,            'thumbnail': find_param('thumbnail'),            'duration': int(find_param('duration')),        }