aboutsummaryrefslogtreecommitdiff
diff options
context:
space:
mode:
authorSergey M․ <dstftw@gmail.com>2017-02-15 00:52:31 +0700
committerSergey M․ <dstftw@gmail.com>2017-02-15 00:52:31 +0700
commit6092ccd05844976ea946ba5277f2b00ccb5c7920 (patch)
tree487acfd2e3a0db1af4acf94ae02d4265351b3ffd
parent22ce9ad2bdad2bf79b22f82cfff7f58156c9d349 (diff)
[vodpl] Make more robust and add another test (closes #12122)
-rw-r--r--youtube_dl/extractor/vodpl.py22
1 files changed, 9 insertions, 13 deletions
diff --git a/youtube_dl/extractor/vodpl.py b/youtube_dl/extractor/vodpl.py
index f612347ce..9e919708e 100644
--- a/youtube_dl/extractor/vodpl.py
+++ b/youtube_dl/extractor/vodpl.py
@@ -2,35 +2,31 @@
from __future__ import unicode_literals
from .onet import OnetBaseIE
-from ..utils import clean_html
class VODPlIE(OnetBaseIE):
- _VALID_URL = r'https?://vod\.pl/(?:.*/)?(?P<id>[0-9a-zA-Z]+)'
+ _VALID_URL = r'https?://vod\.pl/(?:[^/]+/)+(?P<id>[0-9a-zA-Z]+)'
- _TEST = {
+ _TESTS = [{
'url': 'https://vod.pl/filmy/chlopaki-nie-placza/3ep3jns',
'md5': 'a7dc3b2f7faa2421aefb0ecaabf7ec74',
'info_dict': {
'id': '3ep3jns',
'ext': 'mp4',
'title': 'Chłopaki nie płaczą',
- 'description': 'Kuba Brenner aby pomóc swojemu nieśmiałemu przyjacielowi Oskarowi wynajmuje w agencji towarzyskiej dwie panie. Po upojnej nocy okazuje się, że chłopcy nie byli przygotowani finansowo. "Opiekun artystyczny" dziewczyn zabiera w ramach rekompensaty drogocenną rzeźbę należącą do wujka Oskara. Kłopoty chłopców zaczynają się, gdy Kuba udaje się do agencji aby wykupić figurkę i trafia w sam środek mafijnej transakcji... Idiotyczny przypadek sprawia, że w klubie dochodzi do strzelaniny podczas której Grucha i Bolec zostają ranni, ginie również walizka z pieniędzmi... Podejrzenie pada na Kubę.',
+ 'description': 'md5:f5f03b84712e55f5ac9f0a3f94445224',
'timestamp': 1463415154,
'duration': 5765,
'upload_date': '20160516',
},
- }
+ }, {
+ 'url': 'https://vod.pl/seriale/belfer-na-planie-praca-kamery-online/2c10heh',
+ 'only_matching': True,
+ }]
def _real_extract(self, url):
video_id = self._match_id(url)
webpage = self._download_webpage(url, video_id)
- mvp_id = self._search_mvp_id(webpage)
-
- info_dict = self._extract_from_id(mvp_id, webpage)
- info_dict.update({
- 'id': video_id,
- 'description': clean_html(info_dict['description']).strip().replace('\r', '\n')
- })
-
+ info_dict = self._extract_from_id(self._search_mvp_id(webpage), webpage)
+ info_dict['id'] = video_id
return info_dict