Initial port of core code to Python3.
[automanga.git] / manga / htcache.py
1 import os, hashlib, urllib.request, time
2 pj = os.path.join
3
4 class cache(object):
5     def __init__(self, dir):
6         self.dir = dir
7
8     def mangle(self, url):
9         n = hashlib.md5()
10         n.update(url.encode("ascii"))
11         return n.hexdigest()
12
13     def miss(self, url):
14         with urllib.request.urlopen(url) as s:
15             if s.headers.get("content-encoding") == "gzip":
16                 import gzip, io
17                 return gzip.GzipFile(fileobj=io.BytesIO(s.read()), mode="r").read()
18             return s.read()
19
20     def fetch(self, url, expire=3600):
21         path = pj(self.dir, self.mangle(url))
22         if os.path.exists(path):
23             if time.time() - os.stat(path).st_mtime < expire:
24                 with open(path, "rb") as f:
25                     return f.read()
26         data = self.miss(url)
27         if not os.path.isdir(self.dir):
28             os.makedirs(self.dir)
29         with open(path, "wb") as f:
30             f.write(data)
31         return data
32
33 home = os.getenv("HOME")
34 if home is None or not os.path.isdir(home):
35     raise Exception("Could not find home directory for HTTP caching")
36 default = cache(pj(home, ".manga", "htcache"))
37
38 def fetch(url, expire=3600):
39     return default.fetch(url, expire)