Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

[dsm][HTML] namespace inválido (w) em XML impede de lidar com o XML #375

Open
robertatakenaka opened this issue Nov 12, 2020 · 4 comments · Fixed by #382
Open

[dsm][HTML] namespace inválido (w) em XML impede de lidar com o XML #375

robertatakenaka opened this issue Nov 12, 2020 · 4 comments · Fixed by #382
Assignees
Labels
bug Something isn't working

Comments

@robertatakenaka
Copy link
Member

robertatakenaka commented Nov 12, 2020

Descrição do problema

Descreva de forma clara e objetiva o problema relatado.

Passos para reproduzir o problema

  1. Acesse o dsteste
  2. Execute
cat /mnt/vol_dsteste/migracao/html_migracao/2013/logs/convert.log | grep ERR | grep "Could not convert file"
  1. Observe o erro apresentado

Exemplo:

<place w:st="on">Washington: American Psychiatric Association; 1994.</place>
<ref id="B5">
        <label>5</label>
        <mixed-citation>5. American Psychiatric Association. Diagnostic and statistical manual of mental disorders, fourth edition: DSM-IV. <place w:st="on">Washington: American Psychiatric Association; 1994.</place></mixed-citation>
        <element-citation publication-type="book">
          <source>Diagnostic and statistical manual of mental disorders, fourth edition: DSM-IV</source>
          <date>
            <year>1994</year>
          </date>
        </element-citation>
      </ref>

Comportamento esperado

Não sei dizer qual é o comportamento esperado, minimamente é não existir o namespace w:.
No entanto, sugiro investigar os casos em que ocorreu o namespace para saber a origem e então decidimos o que deve ser feito. Seria <place> uma tag do HTML ou do "Word"?
SErá que isso só ocorreu dentro de mixed-citations?

Screenshots ou vídeos

n/a

Anexos

n/a

Ambiente utilizado

dsteste ao migrar HTML 2013

@robertatakenaka robertatakenaka added the bug Something isn't working label Nov 12, 2020
@joffilyfe joffilyfe self-assigned this Nov 13, 2020
@joffilyfe
Copy link
Contributor

@robertatakenaka neste exemplo me parece que o atributo tem alguma relação com o programa que definiu essa tag <place>. Eu já vi o mesmo erro quando estava fazendo a carga de algumas citações no article meta, na época eu tomei a liberdade de converter o namespace em algo assim w-st, dessa forma o dado é mantido mas com outra semântica. Eu também busquei na internet sobre esse namespace e não consegui encontrar nenhuma informação relevante.

@robertatakenaka você acha que poderíamos adotar a mesma estratégia aqui?

@robertatakenaka
Copy link
Member Author

robertatakenaka commented Dec 2, 2020

Não ocorre somente em mixed-citation, mas sim em outras partes do body.
Verificar S0001-37652010000400028. Isso impede o término da conversão.

@robertatakenaka
Copy link
Member Author

Em html_migracao/1981/source/S0004-282X1981000400015.xml

&lt;p&gt;Não há setor da Neurologia &lt;personname productid="em que Alajouanine" w:st="on"&gt;em que Alajouanine&lt;/personname&gt;

Finaliza a conversão com sucesso, no entanto não é possível empacotar:

<personname productid="em que Alajouanine" w:st="on">em que Alajouanine</personname>

Porque fica mal formado após conversion

@robertatakenaka robertatakenaka changed the title [dsm] namespace inválido (w) em XML impede de lidar com o XML [dsm][HTML] namespace inválido (w) em XML impede de lidar com o XML Jan 26, 2021
@joffilyfe joffilyfe removed their assignment Jan 27, 2021
@robertatakenaka robertatakenaka self-assigned this Jan 29, 2021
@robertatakenaka
Copy link
Member Author

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
bug Something isn't working
Projects
None yet
Development

Successfully merging a pull request may close this issue.

2 participants