[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Problems with Victoria Day implementation of PCL



I am using the PCL implementation
Victoria Day to implement a parser (a chart parser, for
unification based grammars).
In the output files of the parser, I came accross items like:
      #<unknown-object 1306eab>
Scanning Victoria-Day source files, I did not find the string
"unknown-object"
Furthermore, (make-instance 'unknown-object) triggers an error.
There is no class named "unknown-object"

While parsing the same text, with the same grammar and the same
dictionary, I noticed that the "unknown-objects" appeared
at slightly different places. For instance (I am using French
Trade-Unions manifestos to test my parser):
First parse of a text:
 e<quilibre  du  secteur  locatif  #<unknown-object 130547b>  entrai^\nant
par
 la>  me^me  #<unknown-object 1306eab>  des  de<penses  d  aide
 a>  la  personne  d  autant  plus  importantes
 #<unknown-object 130bbc3>  re<affirme  sa  volonte<  de  voir  les
 partenaires  sociaux  repre<sentant  les  salarie<s  plus  largement
 associe<s  a>  la  gestion  et  au  contro^le
 de  la  participation  des  entreprises  a>  l
 effort  de  construction  #<unknown-object 1316a9b>  le  *1%
#<unkn\o\wn-object 13171b3>
 et  re<clame  dans  ce  cadre  #<unknown-object 131801b>  l
 extension  a>  toutes  les  entreprises  du  secteur
 prive<  qui  n  y  sont  pas  encore
 soumises  #<unknown-object 131b553>  au  secteur  public  et
nation\alise<
 et  au  secteur  agricole  #<unknown-object 131ce3b>  le  paritarism\e\
 re<el  dans  les  conseils  d  administration  des
 organismes  collecteurs  a>  tous  les  niveaux  #<unknown-object
13\1\fbc3>
 et  dans  toutes  les  instances  de  de<cision
 #<unknown-object 132117b>  l  emploi  judicieux  des  fonds  collect\e\<s
 pour  mieux  re<pondre  aux  besoins  des  salarie<s
 et  une  meilleure  re<partition  au  profit  des
 constructeurs  de  logements  sociaux  #<unknown-object 13260eb> )
Second parse of the same text
 e<quilibre  du  secteur  locatif  ","  entrai^nant  par
 la>  me^me  ","  des  de<penses  d  aide
 a>  la  personne  d  autant  plus  importantes
 ";"  re<affirme  sa  volonte<  de  voir  les
 partenaires  sociaux  repre<sentant  les  salarie<s  plus  largement
 associe<s  a>  la  gestion  et  au  contro^le
 de  la  participation  des  entreprises  a>  l
 effort  de  construction  "("  le  *1%  ")"
 et  re<clame  dans  ce  cadre  ":"  l
 extension  a>  toutes  les  entreprises  du  secteur
 prive<  qui  n  y  sont  pas  encore
 soumises  ","  au  secteur  public  et  nationalise<
 et  au  secteur  agricole  ";"  le  paritarisme
 re<el  dans  les  conseils  d  administration  des  organismes
coll\ecteurs  a>  tous  les  niveaux  #<unknown-object 127\dc23>
 et  dans  toutes  les  instances  de  de<cision
 #<unknown-object 127c613>  l  emploi  judicieux  des  fonds  collect\e\<s
 pour  mieux  re<pondre  aux  besoins  des  salarie<s
 et  une  meilleure  re<partition  au  profit  des
 constructeurs  de  logements  sociaux  "." )

As one can notice in these samples, these "unknown-objects" occur
"in bursts", then do not appear for a while, and occur again.
They replace seemingly punctuation marks which were represented
as strings so as not to interfere with Common Lisp macro-
characters. To test this hypothesis, I replaced in the test text
strings like ";" by symbols like |;| and "unknown-objects" did
not appear any more in the output files.
Another hint: I did not came accross this problem with
Rainy Day.


Have you any idea about the origin of this problem, and any solution
(apart from avoiding strings !)

Benoit Habert