Extractor for canalc2.tv

author: Pierre Rudloff <contact@rudloff.pro> 2013-08-22 13:54:23 +0200
committer: Pierre Rudloff <contact@rudloff.pro> 2013-08-22 13:54:23 +0200
commit: cd0abcc0bb4c218fd02850a139b626d252e22599 (patch)
tree: 99ad4b10e1fd186a2b9151b07310c7a0c50ebf10 /youtube_dl
parent: 05a2926c5c7737e6f17ccf96a35a01ec05fe092b (diff)
2 files changed, 38 insertions, 0 deletions
diff --git a/youtube_dl/extractor/__init__.py b/youtube_dl/extractor/__init__.py
index 9d12608e1..576b8433a 100644
--- a/youtube_dl/extractor/__init__.py
+++ b/youtube_dl/extractor/__init__.py
@@ -7,6 +7,7 @@ from .bliptv import BlipTVIE, BlipTVUserIE
 from .breakcom import BreakIE
 from .brightcove import BrightcoveIE
 from .canalplus import CanalplusIE
+from .canalc2 import Canalc2IE
 from .collegehumor import CollegeHumorIE
 from .comedycentral import ComedyCentralIE
 from .condenast import CondeNastIE
diff --git a/youtube_dl/extractor/canalc2.py b/youtube_dl/extractor/canalc2.py
new file mode 100644
index 000000000..d0e2ed536
--- /dev/null
+++ b/youtube_dl/extractor/canalc2.py
@@ -0,0 +1,37 @@
+# coding: utf-8
+"""Extractor for canalc2.tv"""
+import re
+import lxml.html
+
+from .common import InfoExtractor
+
+class Canalc2IE(InfoExtractor):
+    """Extractor for canalc2.tv"""
+    _VALID_URL = r'http://.*?\.canalc2\.tv/video\.asp\?idVideo=(\d+)&voir=oui'
+
+    _TEST = {
+        u'url': u'http://www.canalc2.tv/video.asp?idVideo=12163&voir=oui',
+        u'file': u'12163.mp4',
+        u'md5': u'c00fa80517373764ff5c0b5eb5a58780',
+        u'info_dict': {
+            u'title': u'Terrasses du Numérique'
+        }
+    }
+
+    def _real_extract(self, url):
+        video_id = re.match(self._VALID_URL, url).group(1)
+        webpage = self._download_webpage(url, video_id)
+        file_name = re.search(r"so\.addVariable\('file','(.*?)'\);",
+            webpage).group(1)
+        
+        video_url = 'http://vod-flash.u-strasbg.fr:8080/' + file_name
+        
+        html   = lxml.html.fromstring(webpage)
+        
+        title = html.cssselect('.evenement8')[0].text_content()
+        
+        return {'id': video_id,
+                'ext' : 'mp4',
+                'url' : video_url,
+                'title' : title
+                }
author	Pierre Rudloff <contact@rudloff.pro>	2013-08-22 13:54:23 +0200
committer	Pierre Rudloff <contact@rudloff.pro>	2013-08-22 13:54:23 +0200
commit	cd0abcc0bb4c218fd02850a139b626d252e22599 (patch)
tree	99ad4b10e1fd186a2b9151b07310c7a0c50ebf10 /youtube_dl
parent	05a2926c5c7737e6f17ccf96a35a01ec05fe092b (diff)