Die Struktur des folgenden PDF ist:

Wenn ich analysiere, erhalte ich Folgendes
ECO-698 Acondicionador Frio-Calor ECO-CHI-522 Chimenea eléctrica con patas
Ich habe herausgefunden, wie ich alle ECO-XXXXX vorab abgleichen kann, aber ich weiß nicht, wie ich alle Beschreibungen vorab abgleichen soll
Das funktioniert bei ECO-XXXXXX
Code: Select all
$parser = new \Smalot\PdfParser\Parser();
$pdf = $parser->parseFile('publication.pdf');
$text = $pdf->getText();
echo $text;
$pattern = '/ECO-[.-^*-]{3,}| ECO-[.-^*-]{4,}\s\b[NMB]\b|ECO-[.-^*-]{4,}\sUP| ECO-[.-^*-]{3,}\sUP\s[B-N-M]{1}| ECO-[.-^*-]{3,}\sRX/' ;
preg_match_all($pattern, $text, $array);
echo "";
print_r($array);
Code: Select all
Array ( [0] => Array ( [0] => ECO-698 [1] => ECO-CHI-522 [2]