Ich habe zwei tabs getrennte Dateien (mit jeweils tausend Zeilen): < /p>
Datei1: < /p>
anno1.g20653.t1 anno1.g20674.t1 eud1g02416 eud1g02458 27 +
anno2.g3796.t1 anno1.g20698.t1 eud1g02520 eud1g02556 28 +
< /code>
Datei2: < /p>
scaffold_1 transcript 11256 13613 anno1.g20653.t1
scaffold_1 transcript 25598 47989 anno1.g20066.t2
< /code>
Ich möchte Folgendes machen: Wenn Element in Spalte 1 von Datei1 in Spalte 5 von Datei2 vorhanden ist, drucken Sie die Ausgabedatei3 mit den beiden kombinierten Übereinstimmungsleitungen (tab-getrennte), ignorieren Zeilen ohne Übereinstimmungen: < /p>
Datei3: < /p>
anno1.g20653.t1 anno1.g20674.t1 eud1g02416 eud1g02458 27 + scaffold_1 transcript 11256 13613 anno1.g20653.t1
< /code>
Ich habe Folgendes ausprobiert, aber es extrahiert nur die Zeile aus Datei2: < /p>
awk 'FNR==NR {a[$1]; next} FNR> 1 && $5 in a' File1 File2 > File3
< /code>
awk oder Python -Code wäre nützlich. Danke.
Extrahieren von Zeilen aus zwei Dateien, bei denen in bestimmten Spalten eine Wertangriffe vorhanden ist ⇐ Python
-
- Similar Topics
- Replies
- Views
- Last post