fix quoting in AsyncWgetFileGetter again
[videosite.git] / videosite / DoubleVikingGrabber.pm
1 # Grabber for doubleviking.com
2 #
3 # (c) 2007 by Ralf Ertzinger <ralf@camperquake.de>
4 # licensed under GNU GPL v2
5
6 package videosite::DoubleVikingGrabber;
7
8 use videosite::GrabberBase;
9 @ISA = qw(videosite::GrabberBase);
10
11 use HTML::TokeParser;
12 use Data::Dumper;
13
14 use strict;
15
16 sub new {
17     my $class = shift;
18     my $self = $class->SUPER::new(
19         NAME => 'doubleviking',
20         PATTERNS => ['(http://(?:[-a-zA-Z0-9_.]+\.)*doubleviking.com/videos/(?:[-a-zA-Z0-9_ %]+/)*page0\.html/(\d+)\.html$)'],
21         @_,
22     );
23
24     return bless($self, $class);
25 }
26
27 sub _parse {
28     my $self = shift;
29     my $url = shift;
30     my $pattern = shift;
31     my $content;
32     my $metadata = {};
33     my $p;
34     my @accum;
35     my @text;
36     my $e;
37
38     $url =~ m|$pattern|;
39     $url = $1;
40
41     $metadata->{'URL'} = $url;
42     $metadata->{'ID'} = $2;
43     $metadata->{'TYPE'} = 'video';
44     $metadata->{'SOURCE'} = $self->{'NAME'};
45     $metadata->{'TITLE'} = undef;
46     $metadata->{'DLURL'} = undef;
47
48     unless(defined($content = $self->simple_get(sprintf('http://www.doubleviking.com/videos/page0.html/%s.html', $2)))) {
49         $self->error('Could not download %s', $url);
50         return undef;
51     }
52
53     $p = HTML::TokeParser->new(\$content);
54
55     # Look for the title
56     if ($p->get_tag('title')) {
57         $metadata->{'TITLE'} = $p->get_text();
58         $metadata->{'TITLE'} =~ s/^\s*(.*) - DoubleViking Video\s*$/$1/im;
59     }
60
61     # Look for the download URL
62     while ($e = $p->get_tag('embed')) {
63         if (exists($e->[1]{'flashvars'})) {
64             print Dumper \$e;
65             my $c = $e->[1]{'flashvars'};
66             if ($c =~ m|\&file=([^\&]+)\&|) {
67                 $metadata->{'DLURL'} = $1;
68             }
69         }
70     }
71
72     unless(defined($metadata->{'DLURL'}) && defined($metadata->{'TITLE'})) {
73         $self->error('Could not determine download URL');
74         return undef;
75     }
76
77     return $metadata;
78 }
79
80 1;