fix quoting in AsyncWgetFileGetter again
[videosite.git] / videosite / VeohGrabber.pm
1 # (c) 2009 by Ralf Ertzinger <ralf@camperquake.de>
2 # licensed under GNU GPL v2
3 #
4 # Grabber for veoh.com
5
6 package videosite::VeohGrabber;
7
8 use videosite::GrabberBase;
9 @ISA = qw(videosite::GrabberBase);
10
11 use HTML::TokeParser;
12 use Data::Dumper;
13 use strict;
14
15 sub new {
16     my $class = shift;
17     my $self = $class->SUPER::new(
18         NAME => 'veoh',
19         _SELFTESTURL => 'http://www.veoh.com/watch/v18348952fyn2twbe',
20         _SELFTESTTITLE => '518_2 kureyon shinchan',
21         PATTERNS => ['(http://(?:[-a-zA-Z0-9_.]+\.)*veoh.com/+watch/(\w+)\??)'],
22         @_,
23     );
24
25     return bless($self, $class);
26 }
27
28 sub _parse {
29     my $self = shift;
30     my $url = shift;
31     my $pattern = shift;
32     my $content;
33     my $metadata = {};
34     my $ua = $self->ua();
35     my $p;
36     my $t;
37     my @text;
38     my @accum;
39     my $dlurl;
40     my $r;
41
42     $url =~ m|$pattern|;
43     $url = $1;
44
45     $metadata->{'URL'} = $url;
46     $metadata->{'ID'} = $2;
47     $metadata->{'TYPE'} = 'video';
48     $metadata->{'SOURCE'} = $self->{'NAME'};
49     $metadata->{'TITLE'} = undef;
50     $metadata->{'DLURL'} = undef;
51
52     unless(defined($content = $self->simple_get(sprintf('http://www.veoh.com/watch/%s', $2), $ua))) {
53         $self->error('Could not download');
54         return undef;
55     }
56
57     $p = HTML::TokeParser->new(\$content);
58
59     while ($t = $p->get_tag('script')) {
60         if ($t->[0] eq 'script') {
61             my $e = $p->get_text();
62             my $jsp;
63
64             if ($e =~ m|__watch.videoDetailsJSON = '([^\x27]+)|) {
65                 $self->debug("Found JSON: %s", $1);
66                 $jsp = videosite::JSArrayParser->new();
67                 $r = $jsp->parse($1);
68
69                 unless(defined($r)) {
70                     $self->error("Found information hash, but could not parse");
71                     return undef;
72                 }
73
74                 $self->debug("Parsed JSON: %s", Dumper($r));
75
76                 unless(exists($r->{previewUrl})) {
77                     $self->error("previewUrl not found in information hash");
78                     return undef;
79                 }
80
81                 $metadata->{'DLURL'} = $r->{previewUrl};
82                 $metadata->{'TITLE'} = $r->{title};
83             }
84         }
85     }
86
87     unless(defined($metadata->{'DLURL'}) && defined($metadata->{'TITLE'})) {
88         $self->error('Could not extract download URL and title');
89         return undef;
90     }
91
92     return $metadata;
93 }
94
95 1;