add logging of PC92A ip addresses
[spider.git] / perl / AnnTalk.pm
index 84f9c481b6d93672c5ded5dbb1e34333651b4cfb..f6b4653d28d497b9a854de43a206dc470eb86a58 100644 (file)
@@ -17,8 +17,8 @@ use DXVars;
 
 use vars qw(%dup $duplth $dupage $filterdef);
 
-$duplth = 60;                                  # the length of text to use in the deduping
-$dupage = 5*3600;                      # the length of time to hold ann dups
+$duplth = 30;                                  # the length of text to use in the deduping
+$dupage = 5*3600;                              # the length of time to hold ann dups
 $filterdef = bless ([
                          # tag, sort, field, priv, special parser 
                          ['by', 'c', 0],
@@ -47,7 +47,7 @@ sub dup
        chomp $text;
        unpad($text);
        $text =~ s/\%([0-9A-F][0-9A-F])/chr(hex($1))/eg;
-       $text = Encode::encode("iso-8859-1", $text) if $main::can_encode && Encode::is_utf8($text, 1);
+#      $text = Encode::encode("iso-8859-1", $text) if $main::can_encode && Encode::is_utf8($text, 1);
        $text =~ s/[^\#a-zA-Z0-9]//g;
        $text = substr($text, 0, $duplth) if length $text > $duplth; 
        my $dupkey = "A$call|$to|\L$text";