Python urllib2 Podstawowy problem uwierzytelniania

81

Aktualizacja: na podstawie komentarza Lee postanowiłem skondensować swój kod do naprawdę prostego skryptu i uruchomić go z linii poleceń:

import urllib2
import sys

username = sys.argv[1]
password = sys.argv[2]
url = sys.argv[3]
print("calling %s with %s:%s\n" % (url, username, password))

passman = urllib2.HTTPPasswordMgrWithDefaultRealm()
passman.add_password(None, url, username, password)
urllib2.install_opener(urllib2.build_opener(urllib2.HTTPBasicAuthHandler(passman)))

req = urllib2.Request(url)
f = urllib2.urlopen(req)
data = f.read()
print(data)

Niestety nadal nie wygeneruje Authorizationnagłówka (na Wireshark) :(

Mam problem z wysłaniem podstawowego uwierzytelniania AUTH przez urllib2. Rzuciłem okiem na ten artykuł i poszedłem za przykładem. Mój kod:

passman = urllib2.HTTPPasswordMgrWithDefaultRealm()
passman.add_password(None, "api.foursquare.com", username, password)
urllib2.install_opener(urllib2.build_opener(urllib2.HTTPBasicAuthHandler(passman)))

req = urllib2.Request("http://api.foursquare.com/v1/user")    
f = urllib2.urlopen(req)
data = f.read()

Widzę następujące informacje w Wire przez wireshark:

GET /v1/user HTTP/1.1
Host: api.foursquare.com
Connection: close
Accept-Encoding: gzip
User-Agent: Python-urllib/2.5 

Możesz zobaczyć, że autoryzacja nie została wysłana, a kiedy wysyłam żądanie przez curl: curl -u user:password http://api.foursquare.com/v1/user

GET /v1/user HTTP/1.1
Authorization: Basic =SNIP=
User-Agent: curl/7.19.4 (universal-apple-darwin10.0) libcurl/7.19.4 OpenSSL/0.9.8k zlib/1.2.3
Host: api.foursquare.com
Accept: */*

Z jakiegoś powodu mój kod nie wysyła uwierzytelnienia - ktoś widzi, czego mi brakuje?

dzięki

-Szymon

Szymon
źródło
1
Zastanawiam się, czy problem polega na tym, że witryna nie zwraca 'WWW-Authenticate'nagłówka. Możesz to sprawdzić, korzystając z try: urllib2.urlopen(req) except urllib2.HTTPError, e: print e.headers odpowiedzi na ten wpis SO .
Mark Mikofski

Odpowiedzi:

199

Problem może polegać na tym, że biblioteki Pythona, zgodnie ze standardem HTTP, najpierw wysyłają nieuwierzytelnione żądanie, a dopiero wtedy, gdy odpowiedź jest ponowieniem 401, wysyłane są prawidłowe poświadczenia. Jeśli serwery Foursquare nie wykonują „całkowicie standardowego uwierzytelniania”, biblioteki nie będą działać.

Spróbuj użyć nagłówków do uwierzytelnienia:

import urllib2, base64

request = urllib2.Request("http://api.foursquare.com/v1/user")
base64string = base64.b64encode('%s:%s' % (username, password))
request.add_header("Authorization", "Basic %s" % base64string)   
result = urllib2.urlopen(request)

Miałem ten sam problem co Ty i znalazłem rozwiązanie z tego wątku: http://forums.shopify.com/categories/9/posts/27662

yayitswei
źródło
Błąd HTTP 505: Wersja HTTP nie jest obsługiwana; (
Daniel Magnusson
Działa również z uwierzytelnianiem paypal (w celu otrzymania access_token). Wielkie dzięki, stary!
DerShodan
3
Zauważ, że base64.b64encodezamiast tego możesz po prostu wywołać, base64.encodestringa wtedy nie musisz zastępować nowej linii.
Trey Stout
Dzięki @TreyStout, zredagowałem rozwiązanie, aby uwzględnić Twoją sugestię.
yayitswei
Podobny problem tutaj..W przeglądarce ładuje się zawartość autoryzowanej strony i jeśli kliknę przycisk anulowania, widzę zawartość strony z hasłem
Mostafa
5

(kopiuj-wklej / dostosowane z https://stackoverflow.com/a/24048772/1733117 ).

Najpierw możesz podklasę urllib2.BaseHandlerlub urllib2.HTTPBasicAuthHandler, i zaimplementuj http_requesttak, aby każde żądanie miało odpowiedni Authorizationnagłówek.

import urllib2
import base64

class PreemptiveBasicAuthHandler(urllib2.HTTPBasicAuthHandler):
    '''Preemptive basic auth.

    Instead of waiting for a 403 to then retry with the credentials,
    send the credentials if the url is handled by the password manager.
    Note: please use realm=None when calling add_password.'''
    def http_request(self, req):
        url = req.get_full_url()
        realm = None
        # this is very similar to the code from retry_http_basic_auth()
        # but returns a request object.
        user, pw = self.passwd.find_user_password(realm, url)
        if pw:
            raw = "%s:%s" % (user, pw)
            auth = 'Basic %s' % base64.b64encode(raw).strip()
            req.add_unredirected_header(self.auth_header, auth)
        return req

    https_request = http_request

Jeśli tak jak ja jesteś leniwy, zainstaluj program obsługi globalnie

api_url = "http://api.foursquare.com/"
api_username = "johndoe"
api_password = "some-cryptic-value"

auth_handler = PreemptiveBasicAuthHandler()
auth_handler.add_password(
    realm=None, # default realm.
    uri=api_url,
    user=api_username,
    passwd=api_password)
opener = urllib2.build_opener(auth_handler)
urllib2.install_opener(opener)
dnozay
źródło
5

Oto, czego używam, aby poradzić sobie z podobnym problemem, który napotkałem podczas próby uzyskania dostępu do API MailChimp. Robi to samo, tylko ładniej sformatowany.

import urllib2
import base64

chimpConfig = {
    "headers" : {
    "Content-Type": "application/json",
    "Authorization": "Basic " + base64.encodestring("hayden:MYSECRETAPIKEY").replace('\n', '')
    },
    "url": 'https://us12.api.mailchimp.com/3.0/'}

#perform authentication
datas = None
request = urllib2.Request(chimpConfig["url"], datas, chimpConfig["headers"])
result = urllib2.urlopen(request)
Hayden Shelton
źródło
4

Drugi parametr musi być identyfikatorem URI, a nie nazwą domeny. to znaczy

passman = urllib2.HTTPPasswordMgrWithDefaultRealm()
passman.add_password(None, "http://api.foursquare.com/", username, password)
Zawietrzny
źródło
1
Dzięki - Powinienem wspomnieć, że próbowałem w wielu różnych kombinacjach http://api.foursquare.com, api.foursquare.com, http://api.foursquare.com/v1/, ale to nie wydaje się, aby rozwiązać ten problem.
Simon
Właśnie wypróbowałem to na lokalnym serwerze, który wymaga podstawowej autoryzacji, a adres URL w add_password działał dobrze. Dlatego sugerowałbym, że szykuje się coś innego.
Lee
To zadziała tylko wtedy, gdy odpowiedź http zawiera kod 401 Unauthorized i nagłówek 'WWW-Authenticate'; zobacz odpowiedź na ten post .
Mark Mikofski
0

Sugerowałbym, że obecnym rozwiązaniem jest użycie mojego pakietu urllib2_prior_auth, który całkiem ładnie to rozwiązuje (pracuję nad włączeniem do standardowego lib.

mcepl
źródło
Wil to pozwala na otwieranie adresów URL, takich jakurllib2.urlopen('http://USER:[email protected]/path/')
ddofborg
To kolejny problem. Czy na pewno to nie działa ze standardem urllib2?
mcepl