zolfa
/
youtube-dl

# coding: utf-8from __future__ import unicode_literals
from .common import InfoExtractorfrom ..compat import (    compat_HTTPError,    compat_str,)from ..utils import (    ExtractorError,    int_or_none,    float_or_none,    parse_resolution,    str_or_none,    try_get,    unified_timestamp,    url_or_none,    urljoin,)

class PuhuTVIE(InfoExtractor):    _VALID_URL = r'https?://(?:www\.)?puhutv\.com/(?P<id>[^/?#&]+)-izle'    IE_NAME = 'puhutv'    _TESTS = [{        # film        'url': 'https://puhutv.com/sut-kardesler-izle',        'md5': 'a347470371d56e1585d1b2c8dab01c96',        'info_dict': {            'id': '5085',            'display_id': 'sut-kardesler',            'ext': 'mp4',            'title': 'Süt Kardeşler',            'description': 'md5:ca09da25b7e57cbb5a9280d6e48d17aa',            'thumbnail': r're:^https?://.*\.jpg$',            'duration': 4832.44,            'creator': 'Arzu Film',            'timestamp': 1561062602,            'upload_date': '20190620',            'release_year': 1976,            'view_count': int,            'tags': list,        },    }, {        # episode, geo restricted, bypassable with --geo-verification-proxy        'url': 'https://puhutv.com/jet-sosyete-1-bolum-izle',        'only_matching': True,    }, {        # 4k, with subtitles        'url': 'https://puhutv.com/dip-1-bolum-izle',        'only_matching': True,    }]    _SUBTITLE_LANGS = {        'English': 'en',        'Deutsch': 'de',        'عربى': 'ar'    }
    def _real_extract(self, url):        display_id = self._match_id(url)
        info = self._download_json(            urljoin(url, '/api/slug/%s-izle' % display_id),            display_id)['data']
        video_id = compat_str(info['id'])        show = info.get('title') or {}        title = info.get('name') or show['name']        if info.get('display_name'):            title = '%s %s' % (title, info['display_name'])
        try:            videos = self._download_json(                'https://puhutv.com/api/assets/%s/videos' % video_id,                display_id, 'Downloading video JSON',                headers=self.geo_verification_headers())        except ExtractorError as e:            if isinstance(e.cause, compat_HTTPError) and e.cause.code == 403:                self.raise_geo_restricted()            raise
        urls = []        formats = []
        def add_http_from_hls(m3u8_f):            http_url = m3u8_f['url'].replace('/hls/', '/mp4/').replace('/chunklist.m3u8', '.mp4')            if http_url != m3u8_f['url']:                f = m3u8_f.copy()                f.update({                    'format_id': f['format_id'].replace('hls', 'http'),                    'protocol': 'http',                    'url': http_url,                })                formats.append(f)
        for video in videos['data']['videos']:            media_url = url_or_none(video.get('url'))            if not media_url or media_url in urls:                continue            urls.append(media_url)
            playlist = video.get('is_playlist')            if (video.get('stream_type') == 'hls' and playlist is True) or 'playlist.m3u8' in media_url:                m3u8_formats = self._extract_m3u8_formats(                    media_url, video_id, 'mp4', entry_protocol='m3u8_native',                    m3u8_id='hls', fatal=False)                for m3u8_f in m3u8_formats:                    formats.append(m3u8_f)                    add_http_from_hls(m3u8_f)                continue
            quality = int_or_none(video.get('quality'))            f = {                'url': media_url,                'ext': 'mp4',                'height': quality            }            video_format = video.get('video_format')            is_hls = (video_format == 'hls' or '/hls/' in media_url or '/chunklist.m3u8' in media_url) and playlist is False            if is_hls:                format_id = 'hls'                f['protocol'] = 'm3u8_native'            elif video_format == 'mp4':                format_id = 'http'            else:                continue            if quality:                format_id += '-%sp' % quality            f['format_id'] = format_id            formats.append(f)            if is_hls:                add_http_from_hls(f)        self._sort_formats(formats)
        creator = try_get(            show, lambda x: x['producer']['name'], compat_str)
        content = info.get('content') or {}
        images = try_get(            content, lambda x: x['images']['wide'], dict) or {}        thumbnails = []        for image_id, image_url in images.items():            if not isinstance(image_url, compat_str):                continue            if not image_url.startswith(('http', '//')):                image_url = 'https://%s' % image_url            t = parse_resolution(image_id)            t.update({                'id': image_id,                'url': image_url            })            thumbnails.append(t)
        tags = []        for genre in show.get('genres') or []:            if not isinstance(genre, dict):                continue            genre_name = genre.get('name')            if genre_name and isinstance(genre_name, compat_str):                tags.append(genre_name)
        subtitles = {}        for subtitle in content.get('subtitles') or []:            if not isinstance(subtitle, dict):                continue            lang = subtitle.get('language')            sub_url = url_or_none(subtitle.get('url') or subtitle.get('file'))            if not lang or not isinstance(lang, compat_str) or not sub_url:                continue            subtitles[self._SUBTITLE_LANGS.get(lang, lang)] = [{                'url': sub_url            }]
        return {            'id': video_id,            'display_id': display_id,            'title': title,            'description': info.get('description') or show.get('description'),            'season_id': str_or_none(info.get('season_id')),            'season_number': int_or_none(info.get('season_number')),            'episode_number': int_or_none(info.get('episode_number')),            'release_year': int_or_none(show.get('released_at')),            'timestamp': unified_timestamp(info.get('created_at')),            'creator': creator,            'view_count': int_or_none(content.get('watch_count')),            'duration': float_or_none(content.get('duration_in_ms'), 1000),            'tags': tags,            'subtitles': subtitles,            'thumbnails': thumbnails,            'formats': formats        }

class PuhuTVSerieIE(InfoExtractor):    _VALID_URL = r'https?://(?:www\.)?puhutv\.com/(?P<id>[^/?#&]+)-detay'    IE_NAME = 'puhutv:serie'    _TESTS = [{        'url': 'https://puhutv.com/deniz-yildizi-detay',        'info_dict': {            'title': 'Deniz Yıldızı',            'id': 'deniz-yildizi',        },        'playlist_mincount': 205,    }, {        # a film detail page which is using same url with serie page        'url': 'https://puhutv.com/kaybedenler-kulubu-detay',        'only_matching': True,    }]
    def _extract_entries(self, seasons):        for season in seasons:            season_id = season.get('id')            if not season_id:                continue            page = 1            has_more = True            while has_more is True:                season = self._download_json(                    'https://galadriel.puhutv.com/seasons/%s' % season_id,                    season_id, 'Downloading page %s' % page, query={                        'page': page,                        'per': 40,                    })                episodes = season.get('episodes')                if isinstance(episodes, list):                    for ep in episodes:                        slug_path = str_or_none(ep.get('slugPath'))                        if not slug_path:                            continue                        video_id = str_or_none(int_or_none(ep.get('id')))                        yield self.url_result(                            'https://puhutv.com/%s' % slug_path,                            ie=PuhuTVIE.ie_key(), video_id=video_id,                            video_title=ep.get('name') or ep.get('eventLabel'))                page += 1                has_more = season.get('hasMore')
    def _real_extract(self, url):        playlist_id = self._match_id(url)
        info = self._download_json(            urljoin(url, '/api/slug/%s-detay' % playlist_id),            playlist_id)['data']
        seasons = info.get('seasons')        if seasons:            return self.playlist_result(                self._extract_entries(seasons), playlist_id, info.get('name'))
        # For films, these are using same url with series        video_id = info.get('slug') or info['assets'][0]['slug']        return self.url_result(            'https://puhutv.com/%s-izle' % video_id,            PuhuTVIE.ie_key(), video_id)