Added enconding to utf-8
authorGermán Poo-Caamaño <gpoo@gnome.org>
Mon, 3 Oct 2011 07:33:53 +0000 (00:33 -0700)
committerSantiago Dueñas <sduenas@libresoft.es>
Thu, 6 Oct 2011 08:10:12 +0000 (10:10 +0200)
commit93c0254cdb507ca9eddb4e9a04458bdef5e73894
tree04394f25a1a6caa9fe82a002d491a85993ed8085
parentf6e755f900e04592002bd905b46ba10959fbd7a9
Added enconding to utf-8

* Convert the input messages (header and body) to unicode.
* Use None for headers with no value instead of ''.  In the
  database they will become NULL, which is most appropriate and
  it less prone to errors (ie. confuse to columns with '' as
  equivalents when they might not)
* Generate an unique message-id when the message does not
  contains one.  The message-id is generated using the body and
  the sender's domain.  Additionally, it is added 'mlstats' to make
  it easier to distinguish with respect to the legimite ones.
  When the message-is was empty, different messages were taken
  as similars.  All of them shared an empty string as message-id,
  when it was expected to be unique.

Signed-off-by: Germán Poo-Caamaño <gpoo@gnome.org>
pymlstats/analyzer.py
pymlstats/database.py