Fix Vimeo grabber, support SD only video
[videosite.git] / videosite / VeohGrabber.pm
1 # (c) 2009 by Ralf Ertzinger <ralf@camperquake.de>
2 # licensed under GNU GPL v2
3 #
4 # Grabber for veoh.com
5
6 package videosite::VeohGrabber;
7
8 use videosite::GrabberBase;
9 @ISA = qw(videosite::GrabberBase);
10
11 use HTML::TokeParser;
12 use Data::Dumper;
13 use strict;
14
15 sub new {
16     my $class = shift;
17     my $self = $class->SUPER::new();
18
19     $self->{'NAME'} = 'veoh';
20     $self->{_SELFTESTURL} = 'http://www.veoh.com/watch/v18348952fyn2twbe';
21     $self->{_SELFTESTTITLE} = '518_2 kureyon shinchan';
22     $self->{'PATTERNS'} = ['(http://(?:[-a-zA-Z0-9_.]+\.)*veoh.com/+watch/(\w+)\??)'];
23
24     bless($self, $class);
25     $self->_prepare_parameters();
26
27     return $self;
28 }
29
30 sub _parse {
31     my $self = shift;
32     my $url = shift;
33     my $pattern = shift;
34     my $content;
35     my $metadata = {};
36     my $ua = $self->ua();
37     my $p;
38     my $t;
39     my @text;
40     my @accum;
41     my $dlurl;
42     my $r;
43
44     $url =~ m|$pattern|;
45     $url = $1;
46
47     $metadata->{'URL'} = $url;
48     $metadata->{'ID'} = $2;
49     $metadata->{'TYPE'} = 'video';
50     $metadata->{'SOURCE'} = $self->{'NAME'};
51     $metadata->{'TITLE'} = undef;
52     $metadata->{'DLURL'} = undef;
53
54     unless(defined($content = $self->simple_get(sprintf('http://www.veoh.com/watch/%s', $2), $ua))) {
55         $self->error('Could not download');
56         return undef;
57     }
58
59     $p = HTML::TokeParser->new(\$content);
60
61     while ($t = $p->get_tag('script')) {
62         if ($t->[0] eq 'script') {
63             my $e = $p->get_text();
64             my $jsp;
65
66             if ($e =~ m|__watch.videoDetailsJSON = '([^\x27]+)|) {
67                 $self->debug("Found JSON: %s", $1);
68                 $jsp = videosite::JSArrayParser->new();
69                 $r = $jsp->parse($1);
70
71                 unless(defined($r)) {
72                     $self->error("Found information hash, but could not parse");
73                     return undef;
74                 }
75
76                 $self->debug("Parsed JSON: %s", Dumper($r));
77
78                 unless(exists($r->{previewUrl})) {
79                     $self->error("previewUrl not found in information hash");
80                     return undef;
81                 }
82
83                 $metadata->{'DLURL'} = $r->{previewUrl};
84                 $metadata->{'TITLE'} = $r->{title};
85             }
86         }
87     }
88
89     unless(defined($metadata->{'DLURL'}) && defined($metadata->{'TITLE'})) {
90         $self->error('Could not extract download URL and title');
91         return undef;
92     }
93
94     return $metadata;
95 }
96
97 1;