Applying Google Cloud Vision to Image Files to Create IIIF Manifests and TEI/XML Files

Overview I created a library that applies Google Cloud Vision to image files and generates IIIF manifest and TEI/XML files. https://github.com/nakamura196/iiif_tei_py This article explains how to use the library. Usage You can check the usage and more at the following page. https://nakamura196.github.io/iiif_tei_py/ Installing the Library Install the library from the GitHub repository. p i p i n s t a l l h t t p s : / / g i t h u b . c o m / n a k a m u r a 1 9 6 / i i i f _ t e i _ p y Creating a GC Service Account Download a GC (Google Cloud) service account key (JSON file) by referring to articles such as the following. https://book.st-hakky.com/data-science/data-science-gcp-vision-api-setting/ Then create a .env file as follows. G O O G L E _ A P P L I C A T I O N _ C R E D E N T I A L S = y o u r - g o o g l e - c r e d e n t i a l s . j s o n Execution As a sample input image, we use the following image that is also used in the IIIF Cookbook. https://iiif.io/api/presentation/2.1/example/fixtures/resources/page1-full.png Create and execute a file like the following. f c u o C r r r u o o e l t r m d p e _ = u C i p t l i a " _ i i t h t e f h t e n _ t i t t = p _ . e s x c i C : m r _ o / l e p r / _ a y e i f t . C i i e c l i l _ o i f e t r e . _ e e n i p i t o a _ i . / t x m l a h m p o p l o a i = _ r d / w t _ p " i e r . t C n e / h o v s t _ r ( e m g e ) n p C t c l a 0 r i t 1 ( e i u n o r t n u l / t , 2 p . u o 1 t u / . t e x p x m u a l t m " _ p t l e e i / _ f x i m x l t _ u f r i e l s e / _ r p e a s t o h u , r c c e r s e / d p _ a p g a e t 1 h - , f u t l i l t . l p e n = g " " S a m p l e " ) In the above example, the IIIF manifest file is created at ./tmp/01/output.json and the TEI/XML file is created at ./tmp/01/output.xml. Verifying the Results IIIF Below is an example of displaying the IIIF manifest file in Mirador. The contents of the JSON file are as follows. { } " " " } " " ] @ i l , t i c d a y t o " b p e n : e " ] e m { } t l n " s e " " o : " x h : n : t t e " " " " " } " " " ] " ] " t { " S M [ i t l , h w i , a : p : a a d y a e i t n : m n " p b i d e n " / [ p i : e e " ] g t m { } o { } h / l f " l n h h s t t e e e " : " o t " " a t x " s h : n " : : t p a t t " e " : " " " ] i " " " ] : m " t C { " [ 1 [ i t i o i t i / p , p a : 1 1 2 d y t n d y t / l : n ] 8 0 " p e s " p e i e / [ " 0 0 : e m { } " : e m { } { } { } { } { } { } { } { } { } { } { } { } { } { } { } { } { } { } i . / a 0 , " s : " s , , , , , , , , , , , , , , , , , i o e s , " : " " : " f r x " h : [ h : . g a , t " " } " " " " t " " } " " " " " } " " " " " } " " " " " } " " " " " } " " " " " } " " " " " } " " " " " } " " " " " } " " " " " } " " " " " } " " " " " } " " " " " } " " " " " } " " " " " } " " " " " } " " " " " } " " " " " } " " " " i m t A [ b , i t m t t A [ b , i t m t b , i t m t b , i t m t b , i t m t b , i t m t b , i t m t b , i t m t b , i t m t b , i t m t b , i t m t b , i t m t b , i t m t b , i t m t b , i t m t b , i t m t b , i t m t b , i t m t b , i t m t i p p n o d y o a p n o d y o a o d y o a o d y o a o d y o a o d y o a o d y o a o d y o a o d y o a o d y o a o d y o a o d y o a o d y o a o d y o a o d y o a o d y o a o d y o a o d y o a o d y o a / i l : n d " p t r : n d " p t r d " p t r d " p t r d " p t r d " p t r d " p t r d " p t r d " p t r d " p t r d " p t r d " p t r d " p t r d " p t r d " p t r d " p t r d " p t r d " p t r d " p t r a i e / y " " " " " : e i g / y " " " : e i g y " " " : e i g y " " " : e i g y " " " : e i g y " " " : e i g y " " " : e i g y " " " : e i g y " " " : e i g y " " " : e i g y " " " : e i g y " " " : e i g y " " " : e i g y " " " : e i g y " " " : e i g y " " " : e i g y " " " : e i g y " " " : e i g y " " " : e i g p f . t " i t f h w " v e t " t v f " v e " t v f " v e " t v f " v e " t v f " v e " t v f " v e " t v f " v e " t v f " v e " t v f " v e " t v f " v e " t v f " v e " t v f " v e " t v f " v e " t v f " v e " t v f " v e " t v f " v e " t v f " v e " t v f " v e " t v f " v e i o e a : d y o e i " : a t e a : y a o " : a t : y a o " : a t : y a o " : a t : y a o " : a t : y a o " : a t : y a o " : a t : y a o " : a t : y a o " : a t : y a o " : a t : y a o " : a t : y a o " : a t : y a o " : a t : y a o " : a t : y a o " : a t : y a o " : a t : y a o " : a t : y a o " : a t : y a o " : a t a r x t " p r i d h t " x t p l r h t " p l r h t " p l r h t " p l r h t " p l r h t " p l r h t " p l r h t " p l r h t " p l r h t " p l r h t " p l r h t " p l r h t " p l r h t " p l r h t " p l r h t " p l r h t " p l r h t " p l r h t " p b g a i { : e m g t t " i : a i { e u m t " i : { e u m t " i : { e u m t " i : { e u m t " i : { e u m t " i : { e u m t " i : { e u m t " i : { e u m t " i : { e u m t " i : { e u m t " i : { e u m t " i : { e u m t " i : { e u m t " i : { e u m t " i : { e u m t " i : { e u m t " i : { e u m t " i : { e u m t " i : r c / m o " a h h t A o m o " e a t A o " e a t A o " e a t A o " e a t A o " e a t A o " e a t A o " e a t A o " e a t A o " e a t A o " e a t A o " e a t A o " e a t A o " e a t A o " e a t A o " e a t A o " e a t A o " e a t A o " e a t A o e / i p n " : t t " p n n " p n : " t p n n " : " t p n n " : " t p n n " : " t p n n " : " t p n n " : " t p n n " : " t p n n " : " t p n n " : " t p n n " : " t p n n " : " t p n n " : " t p n n " : " t p n n " : " t p n n " : " t p n n " : " t p n n " : " t p n n " : " t p n n " s m i l P h " " : : n " h l P : " : n " h : " : n " h : " : n " h : " : n " h : " : n " h : " : n " h : " : n " h : " : n " h : " : n " h : " : n " h : " : n " h : " : n " h : " : n " h : " : n " h : " : n " h : " : n " h : " : n " h : " : n " h e a i e a t " : : / : t e a " : / : t " : / : t " : / : t " : / : t " : / : t " : / : t " : / : t " : / : t " : / : t " : / : t " : / : t " : / : t " : / : t " : / : t " : / : t " : / : t " : / : t " : / : t n n f . g t I 1 t t . g T " t t T " t t T " t t T " t t T " t t T " t t T " t t T " t t T " t t T " t t T " t t T " t t T " t t T " t t T " t t T " t t T " t t T " t t t i / o e p m " 1 2 e a " p o e e [ " e a " p e [ " e a " p e [ " e a " p e [ " e a " p e [ " e a " p e [ " e a " p e [ " e a " p e [ " e a " p e [ " e a " p e [ " e a " p e [ " e a " p e [ " e a " p e [ " e a " p e [ " e a " p e [ " e a " p e [ " e a " p e [ " e a " p e [ " e a " p a f a r " s a i 8 0 x t p : r " x 0 t x t c : x 0 t x t c : x 0 t x t c : x 0 t x t c : x 0 t x t c : x 0 t x t c : x 0 t x t c : x 0 t x t c : x 0 t x t c : x 0 t x t c : x 0 t x t c : x 0 t x t c : x 0 t x t c : x 0 t x t c : x 0 t x t c : x 0 t x t c : x 0 t x t c : x 0 t x t c : t e b g , : g m 0 0 a i a / g , t 0 e a i o / t 0 e a i o / t 0 e a i o / t 0 e a i o / t 0 e a i o / t 0 e a i o / t 0 e a i o / t 0 e a i o / t 0 e a i o / t 0 e a i o / t 0 e a i o / t 0 e a i o / t 0 e a i o / t 0 e a i o / t 0 e a i o / t 0 e a i o / t 0 e a i o / t 0 e a i o / i s c / / e a 0 m o i / / u 0 x m o m / u 0 x m o m / u 0 x m o m / u 0 x m o m / u 0 x m o m / u 0 x m o m / u 0 x m o m / u 0 x m o m / u 0 x m o m / u 0 x m o m / u 0 x m o m / u 0 x m o m / u 0 x m o m / u 0 x m o m / u 0 x m o m / u 0 x m o m / u 0 x m o m / u 0 x m o m / o t / i / " g , p n n e i a 0 t p n m e a 0 t p n m e a 0 t p n m e a 0 t p n m e a 0 t p n m e a 0 t p n m e a 0 t p n m e a 0 t p n m e a 0 t p n m e a 1 t p n m e a 1 t p n m e a 1 t p n m e a 1 t p n m e a 1 t p n m e a 1 t p n m e a 1 t p n m e a 1 t p n m e a 1 t p n m e n " c i i , e l " t x i l 1 / l " e x l 2 / l " e x l 3 / l " e x l 4 / l " e x l 5 / l " e x l 6 / l " e x l 7 / l " e x l 8 / l " e x l 9 / l " e x l 0 / l " e x l 1 / l " e x l 2 / l " e x l 3 / l " e x l 4 / l " e x l 5 / l " e x l 6 / l " e x l 7 / l " e x l 8 / l " e x / , a i i / e , i a i B ] p e , n a B ] p e , n a B ] p e , n a B ] p e , n a B ] p e , n a B ] p e , n a B ] p e , n a B ] p e , n a B ] p e , n a B ] p e , n a B ] p e , n a B ] p e , n a B ] p e , n a B ] p e , n a B ] p e , n a B ] p e , n a B ] p e , n a B ] p e , n a 3 n f i j . n m f o l . t m o l . t m o l . t m o l . t m o l . t m o l . t m o l . t m o l . t m o l . t m o l . t m o l . t m o l . t m o l . t m o l . t m o l . t m o l . t m o l . t m o l . t m / v / f p o g p / d T a o i p d o a o i p d F a o i p d P a o i p d t a o i p d D a o i p d M a o i p d o a o i p d F a o i p d P a o i p d o a o i p d A a o i p d B a o i p d o a o i p d F a o i p d P a o i p d t a o i p d D a o i p c a a . e r " l a y o i r n l y f i r n l y i i r n l y a i r n l y o i r n l y i i r n l y i i r n l y f i r n l y i i r n l y a i r n l y n i r n l y n i r n l y o i r n l y f i r n l y i i r n l y a i r n l y o i r n l y i i r n l o s b i g g , e b " p n g g e " " n g g e " r n g g e " g n g g e " " n g g e " s n g g e " d n g g e " " n g g e " r n g g e " g n g g e " " n g g e " g n g g e " t n g g e " " n g g e " r n g g e " g n g g e " " n g g e " s n g g e n / c o " / . c , " " / " . , , " / " . , s " / " . , e " / " . , , " / " . , p " / " . , d " / " . , , " / " . , s " / " . , e " / " . , , " / " . , l " / " . , t " / " . , , " / " . , s " / " . , e " / " . , , " / " . , p " / " . t p / / , i o / , i , o i , o t i , o " i , o i , o l i , o l i , o i , o t i , o " i , o i , o e i , o o i , o i , o t i , o " i , o i , o l i , o e 1 a a i r c i r i r " i r , i r i r a i r e i r i r " i r , i r i r " i r m i r i r " i r , i r i r a i r x " n p i g a i g i g , i g i g i g y i g " i g i g , i g i g i g , i g " i g i g , i g i g i g y i g t , n i f / n f / f / f / f / f / " f / , f / f / f / f / f / f / , f / f / f / f / f / " f / . o / / i v / i / i / i / i / i , / i / i / i / i / i / i / i / i / i / i / i / i , / i j t p a i a a i a i a i a i a i a i a i a i a i a i a i a i a i a i a i a i a i a i s a r b i s b i b i b i b i b i b i b i b i b i b i b i b i b i b i b i b i b i b i o t e c f / c f c f c f c f c f c f c f c f c f c f c f c f c f c f c f c f c f c f n i s / / p / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / / " o e a a 1 c a c a c a c a c a c a c a c a c a c a c a c a c a c a c a c a c a c a , n n n b / a b a b a b a b a b a b a b a b a b a b a b a b a b a b a b a b a b a b / t n c c n c n c n c n c n c n c n c n c n c n c n c n c n c n c n c n c n c n c p a o / u v / v / v / v / v / v / v / v / v / v / v / v / v / v / v / v / v / v / 0 t t c r a c a c a c a c a c a c a c a c a c a c a c a c a c a c a c a c a c a c 0 i a a a s a s a s a s a s a s a s a s a s a s a s a s a s a s a s a s a s a s a 0 o t n t / n / n / n / n / n / n / n / n / n / n / n / n / n / n / n / n / n / n 1 n i v i p v p v p v p v p v p v p v p v p v p v p v p v p v p v p v p v p v p v - / o a o 1 a 1 a 1 a 1 a 1 a 1 a 1 a 1 a 1 a 1 a 1 a 1 a 1 a 1 a 1 a 1 a 1 a 1 a i 2 n s n # s # s # s # s # s # s # s # s # s # s # s # s # s # s # s # s # s # s m . / / " x / x / x / x / x / x / x / x / x / x / x / x / x / x / x / x / x / x / a 1 p p , y p y p y p y p y p y p y p y p y p y p y p y p y p y p y p y p y p y p g / 0 1 w 1 w 1 w 1 w 1 w 1 w 1 w 1 w 1 w 1 w 1 w 1 w 1 w 1 w 1 w 1 w 1 w 1 w 1 e e 0 " h # h # h # h # h # h # h # h # h # h # h # h # h # h # h # h # h # h # " x 0 = x = x = x = x = x = x = x = x = x = x = x = x = x = x = x = x = x = x , a 1 2 y 3 y 4 y 5 y 6 y 7 y 2 y 4 y 4 y 5 y 6 y 7 y 2 y 3 y 4 y 5 y 7 y 8 y m - 4 w 5 w 2 w 4 w 9 w 6 w 9 w 3 w 8 w 8 w 9 w 4 w 0 w 9 w 6 w 9 w 4 w 0 w p i 5 h 5 h 0 h 7 h 7 h 3 h 6 h 3 h 4 h 4 h 1 h 9 h 3 h 8 h 6 h 3 h 0 h 8 h l m / = / = / = / = / = / = / = / = / = / = / = / = / = / = / = / = / = / = e a 6 2 6 3 6 4 7 5 7 6 7 7 5 2 7 4 7 4 8 5 9 6 1 7 1 2 1 3 1 4 1 5 1 7 1 8 / g 9 4 9 5 9 2 0 4 1 9 1 6 9 9 3 3 8 8 8 8 9 9 0 4 6 0 6 9 6 6 6 9 6 4 6 0 f e / 5 / 5 / 0 / 7 / 7 / 3 3 6 3 3 6 4 9 4 8 1 5 9 8 3 8 8 8 6 9 3 9 0 9 8 i / 9 , 4 , 1 , 1 , 5 , 1 , / , / , / , / , / , 7 , 6 , 9 , 9 , 0 , 2 , 3 , x a 4 6 9 6 1 6 3 7 0 7 8 7 1 5 7 7 1 7 1 8 8 9 / 1 / 1 / 1 / 1 / 1 / 1 / 1 t n / 9 / 9 2 9 4 0 / 1 9 1 6 9 6 3 2 8 2 8 0 9 1 0 1 6 5 6 1 6 1 6 5 6 1 6 u n 5 , 5 , / , / , 5 , / , 3 3 / 3 3 6 8 9 / 8 4 5 7 8 1 8 0 8 3 9 1 9 9 9 r o 2 9 2 4 5 1 5 1 2 5 5 1 / , 7 , / , / , 8 , 8 7 5 6 / 9 9 9 0 0 / 2 0 3 e " " 4 " 9 4 1 3 3 " 0 4 8 1 1 6 7 1 1 1 1 0 8 / , / , 5 , / , / , 5 , / , s , , , , , " 2 " 4 , , " 9 6 6 " 6 2 2 2 2 " 0 1 1 5 1 3 5 5 1 5 1 4 5 5 1 / 5 5 , , , , 5 , , 4 3 , , 4 3 9 8 , , 4 4 5 7 " 1 4 0 4 3 " 1 4 9 r 2 2 5 5 2 5 " , 7 " , " , 8 9 8 " 5 , , " 9 " 0 , , " 0 e " " 4 3 " 4 , 1 6 , 1 , 1 0 " , , , 5 , , , , 5 , , s " " " 6 " 2 2 " , 1 5 3 5 5 4 5 o 4 4 9 4 5 " 4 4 " 4 u " " " 9 " " " " r " c e s / p a g e 1 - f u l l . p n g " , TEI Below is an example of displaying the TEI/XML file in Oxygen XML Editor. The contents of the XML file are as follows. < < < ? ? T < < < < x x E t < < < < f < < T m m I e f < < < < < < p < < t a s v m m e e t i i b > u u > o l f e i c l r o H i f a n e o n e o n e o n e o n e o n e o n e o n e o n e o n e o n e o n e o n e o n e o n e o n e o n e o n e o r s e o l a D l t t l E b r E u e i a s h i e f e m a p e g n e g n e g n e g n e g n e g n e g n e g n e g n e g n e g n e g n e g n e g n e g n e g n e g n e g n f i r d n d e e l l i x l c x r D l t t a s a i a i c h > e > e > e > e > e > e > e > e > e > e > e > e > e > e > e > e > e > e a m s e s e s S e e c a i e a c e e i C n t t l d l e i l T > l o > l F > l P > l t > l D > l M > l o > l F > l P > l o > l A > l B > l o > l F > l P > l t > l D > c i i l = r c t > S a m c D m e s D o h g C i e e e > c r o r f r i r a r o r i r i r f r i r a r n r n r o r f r i r a r o r i e l o " > > m S t t p a e p D c e n a e h o D r > x p x e n h h t a m i l t s l e > s > n / a n e > u = = r t > m t o e i c e s c g > n > s r " / " s " t " n e g c l 3 s 4 e 5 > e > = 3 e 0 g 3 / 8 s 4 g 5 y 5 " 9 g 4 > 2 s 1 e 7 > 2 7 s 2 e 1 > 7 s 8 / 9 > 5 s 3 e 1 > 8 t > h " > " " e " g " " / " s " " e " g " " e " s " " e " g " " / " h / / t m t g > s e g > g e g > s t w t > t t l l l > l l l e l g l l > l l l > l g l l > l l l e ? t w i > p r r r r r r g r > r r r r r r > r r r r r g > p w t s y y y y y y > y y y y y y y y y y y y > s . l : = = = = = = = = = = = = = = = = = = : t e / " " " " " " " " " " " " " " " " " " / e > / 1 1 1 1 1 1 7 8 9 1 1 1 1 1 1 1 1 1 / i i 2 2 2 2 2 2 5 0 1 0 0 2 7 7 7 7 7 7 t - i 1 1 3 3 3 5 7 9 0 1 7 0 4 4 4 4 4 4 e c i " " " " " " " " " 8 8 6 1 2 3 4 6 7 i . f " " " " " " " " " - o . u u u u u u u u u c r i l l l l l l l l l u u u u u u u u u . g o x x x x x x x x x l l l l l l l l l o / / = = = = = = = = = x x x x x x x x x r n a " " " " " " " " " = = = = = = = = = g s p 2 3 4 5 6 7 2 4 4 " " " " " " " " " / / i 4 5 2 4 9 6 9 3 8 5 6 7 2 3 4 5 7 8 r 1 / 5 5 0 7 7 3 6 3 4 8 9 4 0 9 6 9 4 0 e . p " " " " " " " " " 4 1 9 3 8 6 3 0 8 l 0 r " " " " " " " " " e " e u u u u u u u u u a > s l l l l l l l l l u u u u u u u u u s e y y y y y y y y y l l l l l l l l l e n = = = = = = = = = y y y y y y y y y / t " " " " " " " " " = = = = = = = = = x a 6 6 6 7 7 7 5 7 7 " " " " " " " " " m t 9 9 9 0 1 1 9 3 8 8 9 1 1 1 1 1 1 1 l i " " " " " " 3 3 6 8 9 0 6 6 6 6 6 6 / o " " " 9 8 5 8 8 8 9 9 9 t n x x x x x x " " 7 6 9 9 0 2 3 e / m m m m m m x x x " " " " " " " i 2 l l l l l l m m m x x / . : : : : : : l l l m m x x x x x x x c 1 i i i i i i : : : l l m m m m m m m u / d d d d d d i i i : : l l l l l l l s e = = = = = = d d d i i : : : : : : : t x " " " " " " = = = d d i i i i i i i o a a a a a a a " " " = = d d d d d d d m m _ _ _ _ _ _ a a a " " = = = = = = = / p 0 0 0 0 0 0 _ _ _ a a " " " " " " " s l 0 0 0 0 0 0 0 0 0 _ _ a a a a a a a c e 0 0 0 0 0 0 0 0 0 0 0 _ _ _ _ _ _ _ h / 0 1 2 3 4 5 0 0 0 0 0 0 0 0 0 0 0 0 e f " " " " " " 6 7 8 0 1 0 0 0 0 0 0 0 m i > > > > > > " " " 9 0 1 1 1 1 1 1 1 a x > > > " " 1 2 3 4 5 6 7 / t > > " " " " " " " r u > > > > > > > e r l e a s x / n r g e / s t o e u i r _ c a e l s l / . p r a n g g e " 1 - t f y u p l e l = . " p a n p g p " l / i > c a t i o n / x m l " s c h e m a t y p e n s = " h t t p : / / r e l a x n g . o r g / n s / s t r u c t u r e / 1 . 0 " ? > Summary I hope this serves as a useful reference for use cases such as creating pre-proofreading text using Google Cloud Vision.

Overview#

Usage#

Installing the Library#

Creating a GC Service Account#

Execution#

Verifying the Results#

IIIF#

TEI#

Summary#

Overview

Usage

Installing the Library

Creating a GC Service Account

Execution

Verifying the Results

IIIF

TEI

Summary