Twitter: Decode HTML entities in tweet
authorRalf Ertzinger <ralf@skytale.net>
Tue, 23 Nov 2010 14:29:56 +0000 (15:29 +0100)
committerRalf Ertzinger <ralf@skytale.net>
Tue, 23 Nov 2010 14:29:56 +0000 (15:29 +0100)
quotesite/TwitterGrabber.pm

index 48b3c11..286b962 100644 (file)
@@ -11,6 +11,7 @@ use GrabberBase;
 use LWP::Simple qw(!get);
 use Data::Dumper;
 use XML::Simple;
+use HTML::Entities qw(decode_entities);
 use Encode;
 
 use strict;
@@ -57,7 +58,7 @@ sub _parse {
         return undef;
     }
 
-    $metadata->{'CONTENT'} = $t->{'text'};
+    $metadata->{'CONTENT'} = encode("utf8", decode_entities(decode("utf8", $t->{'text'})));
     $metadata->{'ID'} = $t->{'user'}->{'screen_name'} . '/' . $metadata->{'ID'};
 
     unless(defined($metadata->{'CONTENT'})) {