Jak możemy skopiować tekst z Wikipedii bez części cytatów „[1]”, „[2]”, „[3]”?

10

Jeśli skopiujemy tekst ze strony Wikipedii , otrzymamy mniej więcej to:

Odstępy między zdaniami to pozioma przestrzeń między zdaniami w tekście. Jest to kwestia konwencji typograficznej. [1] Od czasu wprowadzenia druku ruchomego w Europie w językach z alfabetem łacińskim stosowano różne konwencje odstępów między zdaniami. [2] Obejmują one normalną spację słów (między słowami w zdaniu), pojedynczą powiększoną spację, dwie pełne spacje, a ostatnio w mediach cyfrowych brak spacji. [3] Chociaż współczesne czcionki cyfrowe mogą automatycznie dostosowywać odstęp pojedynczego słowa, aby tworzyć przyjemne wizualnie i spójne odstępy po interpunkcji terminala, [4] większość debat dotyczy tego, czy należy nacisnąć spację na klawiaturze raz czy dwa razy między zdaniami. [5]

Nie chcę, aby skopiować części [1]i [2]itd. To jest rzeczywiście to, co chciałem skopiować:

Odstępy między zdaniami to pozioma przestrzeń między zdaniami w tekście. Jest to kwestia konwencji typograficznej. Od czasu wprowadzenia druku ruchomego w Europie w językach z alfabetem łacińskim stosowano różne konwencje odstępów między zdaniami. Obejmują one normalną spację słów (między słowami w zdaniu), pojedynczą powiększoną spację, dwie pełne spacje, a ostatnio w mediach cyfrowych - brak spacji. Chociaż nowoczesne czcionki cyfrowe mogą automatycznie dostosowywać odstęp pojedynczego słowa, aby tworzyć przyjemne wizualnie i spójne odstępy po interpunkcji terminala, większość debat dotyczy tego, czy raz czy dwa razy wstawiać spację na klawiaturze między zdaniami.

Wybrana poniżej odpowiedź używa wyrażenia regularnego, ale nie działa za każdym razem . (Jeśli sam tekst zawiera [i ]wyrażenie regularne nie powinno ich usuwać).

Czy są lepsze rozwiązania?

Pacerier
źródło
Są to odniesienia, które prawdopodobnie są ważne, ponieważ często potwierdzają wiarygodność prezentowanych informacji. Dołączanie referencji jest pomocne, szczególnie dla badaczy.
Randolf Richardson,
@Randolf Dołączanie referencji może być pomocne, szczególnie dla naukowców. nie dla normalnych istot, które chcą tylko informacji
Pacerier
Przydaje się tutaj funkcja wyszukiwania i zamiany edytora tekstu, prawdopodobnie wywołana z makra.
Keith,
Nawiasem mówiąc, głosowałem za twoim pytaniem, ponieważ uważam, że jest dobre. Jeśli chodzi o referencje, wiele osób spodziewa się ich zobaczyć, zwłaszcza profesorów na uniwersytecie (jeśli planujesz uczęszczać na jeden, prawie na pewno przekonasz się, że większość profesorów spodziewa się, że referencje zostaną uwzględnione we wszystkich artykułach naukowych, które napiszesz, i prawdopodobnie od czasu do czasu słyszą innych uczniów rozmawiających o referencjach).
Randolf Richardson,
@Randolf mam na myśli, że chcę po prostu przechowywać informacje do osobistego czytania i wykorzystania w przyszłości.
Pacerier

Odpowiedzi:

10

Bookmarklet to twój przyjaciel ...

Utwórz nową zakładkę przeglądarki i skopiuj do niej poniższy kod javascript - jeśli chcesz skopiować tekst z wikipedii, po prostu kliknij go wcześniej, a wszystkie instancje [n] zostaną usunięte, aby spełnić Twoje wymagania w pytaniu.

javascript:function a (){document.body.innerHTML=document.body.innerHTML.replace(/<sup\b[^>]*>(.*?)<\/sup>/gi, "" );return;}; a();

Za kulisami po prostu wykonuje wyszukiwanie wyrażeń regularnych i zastępuje wszystkie <sup>...</sup>tagi HTML na stronie.

Właśnie próbowałem tego w IE7 i działa dobrze, więc mam nadzieję, że powinno być w porządku również w innych przeglądarkach.

Uznam ten wątek SO za skierowanie mnie we właściwym kierunku - wiedziałem, że jest to bookmarklet, ale nigdy go nie napisałem.

Stuart McLaughlin
źródło
1
+1, to jedyny sposób, w jaki mogę to zrobić. Nawet dodatkowe rozszerzenia przeglądarki musiałyby do tego użyć analizy JavaScript (i większość z nich robi to).
Przełom