You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

45 lines
1.8 KiB

11 years ago
11 years ago
11 years ago
11 years ago
11 years ago
11 years ago
11 years ago
11 years ago
  1. # -*- coding: utf-8 -*-
  2. import re
  3. from .common import InfoExtractor
  4. from ..utils import determine_ext
  5. class SztvHuIE(InfoExtractor):
  6. _VALID_URL = r'(?:http://)?(?:(?:www\.)?sztv\.hu|www\.tvszombathely\.hu)/(?:[^/]+)/.+-(?P<id>[0-9]+)'
  7. _TEST = {
  8. u'url': u'http://sztv.hu/hirek/cserkeszek-nepszerusitettek-a-kornyezettudatos-eletmodot-a-savaria-teren-20130909',
  9. u'file': u'20130909.mp4',
  10. u'md5': u'a6df607b11fb07d0e9f2ad94613375cb',
  11. u'info_dict': {
  12. u"title": u"Cserkészek népszerűsítették a környezettudatos életmódot a Savaria téren",
  13. u"description": u'A zöld nap játékos ismeretterjesztő programjait a Magyar Cserkész Szövetség szervezte, akik az ország nyolc városában adják át tudásukat az érdeklődőknek. A PET...',
  14. },
  15. u'skip': u'Service temporarily disabled as of 2013-11-20'
  16. }
  17. def _real_extract(self, url):
  18. mobj = re.match(self._VALID_URL, url)
  19. video_id = mobj.group('id')
  20. webpage = self._download_webpage(url, video_id)
  21. video_file = self._search_regex(
  22. r'file: "...:(.*?)",', webpage, 'video file')
  23. title = self._html_search_regex(
  24. r'<meta name="title" content="([^"]*?) - [^-]*? - [^-]*?"',
  25. webpage, 'video title')
  26. description = self._html_search_regex(
  27. r'<meta name="description" content="([^"]*)"/>',
  28. webpage, 'video description', fatal=False)
  29. thumbnail = self._og_search_thumbnail(webpage)
  30. video_url = 'http://media.sztv.hu/vod/' + video_file
  31. return {
  32. 'id': video_id,
  33. 'url': video_url,
  34. 'title': title,
  35. 'ext': determine_ext(video_url),
  36. 'description': description,
  37. 'thumbnail': thumbnail,
  38. }