Regex zum Suchen eines Teilstrings zwischen zwei Strings, mit Ausnahme eines bestimmten StringsJava

Java-Forum
Guest
 Regex zum Suchen eines Teilstrings zwischen zwei Strings, mit Ausnahme eines bestimmten Strings

Post by Guest »

Ich habe alle bestehenden Fragen auf Stackoverflow überprüft, konnte aber nicht die perfekte Antwort darauf finden und benötige Ihre Hilfe.
Im Grunde habe ich also mehrere Strings mit unterschiedlichen URL-Formaten auf unterschiedliche Weise, zum Beispiel:-
1:

Code: Select all

[url=https://abcd.com/sites/WG-ProductManagementTeam/FunctionalSpecs/Forms/AllItems.aspx?id=/sites/WG-ProductManagementTeam/FunctionalSpecs/DevDOC/Enhancements to PA Peer Checklist/PA Peer Checklist (V2.3) -v10.0.pdf&parent=/sites/WG-ProductManagementTeam/FunctionalSpecs/DevDOC/Enhancements to PA Peer Checklist&p=true&ga=1]WG-Product Management Team - PA Peer Checklist (V2.3) -v10.0.pdf - All Documents (sharepoint.com)[/url]
2:

Code: Select all

https://abcd.com/sites/WG-ProductManagementTeam/FunctionalSpecs/Forms/AllItems.aspx?id=%2Fsites%2FWG%2DProductManagementTeam%2FFunctionalSpecs%2FDevDOC%2FEnhancements%20to%20PA%20Peer%20Checklist%2FPA%20Peer%20Checklist%20%28V2%2E3%29%20%2Dv10%2E0%2Epdf&parent=%2Fsites%2FWG%2DProductManagementTeam%2FFunctionalSpecs%2FDevDOC%2FEnhancements%20to%20PA%20Peer%20Checklist&p=true&ga=1
3:

Code: Select all

https://abcd.com/:b:/r/sites/WG-ProductManagementTeam/FunctionalSpecs/DevDOC/Enhancements%20to%20PA%20Peer%20Checklist/PA%20Peer%20Checklist%20(v2.0)%20-%20v3.0.pdf?csf=1&web=1&e=txs2Yq
Ich möchte einen Teil der URL wie folgt extrahieren:-
/DevDOC/....../.pdf
Wie Sie oben sehen können, sind die 3 freigegebenen URL-Strings alle unterschiedlich, aber ich kann nicht den effizientesten Weg finden, das Problem zu lösen.
Ich muss es so machen So dass es für jede Art von URL-Zeichenfolge funktioniert, auch wenn die Formate unterschiedlich sind, sollte es es aus jeder einzelnen Zeichenfolge in extrahieren auf die gleiche Weise.
Im Moment verwende ich Regex: „./FunctionalSpecs(?!.\1)(.*?)(.pdf)“ und Es funktioniert für die oben genannten URLs 2 und 3, aber im Fall von URL 1 wird Folgendes zurückgegeben:
/DevDOC/Enhancements to PA Peer Checklist&p=true&ga=1'>WG-Product Management Team - PA-Peer Checklist (V2.3) -v10.0.pdf
was falsch ist, ich wollte Folgendes:
/DevDOC/Enhancements to PA Peer Checklist /PA Peer Checklist (V2.3) -v10.0.pdf
Bitte helfen Sie mir, dieses Problem so schnell wie möglich zu lösen, da es so einfach erscheint, aber ich schaffe es nicht in einem effiziente Art und Weise.
Ich versuche es auch in Java.
Jede Hilfe ist sehr willkommen. Vielen Dank.

Quick Reply

Change Text Case: 
   
  • Similar Topics
    Replies
    Views
    Last post