Scrivi la classe TableParser
contenente il metodo:
public static void convertTable(Path htmlFile, Path csvFile)
Tale metodo legge il file in formato HTML htmlFile
. Se nel file HTML è contenuta almeno una tabella, il metodo converte il contenuto della prima tabella contenuta nel file in formato CSV e lo salva nel file csvFile
.
La conversione avviene secondo le regole seguenti:
<!---
,--->
)<table>
e </table>
<tr>
e </tr>
<td>
e </td>
<th>
e </th>
)Ad esempio per un file html contenente:
...
<h1>Tabella di test</h1>
<p>Prova a convertire la seguente tablella:</p>
<!-- Questo è un commento -->
<table><!-- Qui inizia la tabella -->
<tr><!-- Prima riga -->
<td>A</td><td>B</td><td>C</td><td>D</td>
</tr><!-- Fine prima riga -->
<tr><!-- Seconda riga -->
<td>1</td><td>1234</td><td>cane<!--- BAU!!! --->
</td><td>gatto</td>
</tr><!-- Fine seconda riga -->
</table><!-- Qui termina la tabella -->
...
Verrà prodotto il seguente file CSV:
A;B;C;D;
1;1234;cane;gatto;