Change new() function in plugins to avoid having to call _prepare_parameters() in...
[videosite.git] / videosite / VeohGrabber.pm
1 # (c) 2009 by Ralf Ertzinger <ralf@camperquake.de>
2 # licensed under GNU GPL v2
3 #
4 # Grabber for veoh.com
5
6 package videosite::VeohGrabber;
7
8 use videosite::GrabberBase;
9 @ISA = qw(videosite::GrabberBase);
10
11 use HTML::TokeParser;
12 use Data::Dumper;
13 use strict;
14
15 sub new {
16     my $class = shift;
17     my $self = $class->SUPER::new(
18         NAME => 'veoh',
19         _SELFTESTURL => 'http://www.veoh.com/watch/v18348952fyn2twbe',
20         _SELFTESTTITLE => '518_2 kureyon shinchan',
21         PATTERNS => ['(http://(?:[-a-zA-Z0-9_.]+\.)*veoh.com/+watch/(\w+)\??)'],
22     );
23
24     return bless($self, $class);
25 }
26
27 sub _parse {
28     my $self = shift;
29     my $url = shift;
30     my $pattern = shift;
31     my $content;
32     my $metadata = {};
33     my $ua = $self->ua();
34     my $p;
35     my $t;
36     my @text;
37     my @accum;
38     my $dlurl;
39     my $r;
40
41     $url =~ m|$pattern|;
42     $url = $1;
43
44     $metadata->{'URL'} = $url;
45     $metadata->{'ID'} = $2;
46     $metadata->{'TYPE'} = 'video';
47     $metadata->{'SOURCE'} = $self->{'NAME'};
48     $metadata->{'TITLE'} = undef;
49     $metadata->{'DLURL'} = undef;
50
51     unless(defined($content = $self->simple_get(sprintf('http://www.veoh.com/watch/%s', $2), $ua))) {
52         $self->error('Could not download');
53         return undef;
54     }
55
56     $p = HTML::TokeParser->new(\$content);
57
58     while ($t = $p->get_tag('script')) {
59         if ($t->[0] eq 'script') {
60             my $e = $p->get_text();
61             my $jsp;
62
63             if ($e =~ m|__watch.videoDetailsJSON = '([^\x27]+)|) {
64                 $self->debug("Found JSON: %s", $1);
65                 $jsp = videosite::JSArrayParser->new();
66                 $r = $jsp->parse($1);
67
68                 unless(defined($r)) {
69                     $self->error("Found information hash, but could not parse");
70                     return undef;
71                 }
72
73                 $self->debug("Parsed JSON: %s", Dumper($r));
74
75                 unless(exists($r->{previewUrl})) {
76                     $self->error("previewUrl not found in information hash");
77                     return undef;
78                 }
79
80                 $metadata->{'DLURL'} = $r->{previewUrl};
81                 $metadata->{'TITLE'} = $r->{title};
82             }
83         }
84     }
85
86     unless(defined($metadata->{'DLURL'}) && defined($metadata->{'TITLE'})) {
87         $self->error('Could not extract download URL and title');
88         return undef;
89     }
90
91     return $metadata;
92 }
93
94 1;