cb34f7d2

Internet Archive обнародовала на Flickr миллиарды фотографий из старых книжек

Организация Internet Archive обнародовала миллиарды фотографий из собственной коллекции книжек, выполнив их вразумительными совершенно бесплатно на сайте Flickr. Сейчас размещено не менее 2,6 млн фотографий, а это лишь начало — совместное количество извлечённых из отсканированных книжек фотографий составляет 14 млрд.

Это возможно благодаря работе академического работника Джорджтаунского института Калева Литару (Kalev Leetaru), который сделал метод, автоматом извлекающий картинки не менее чем из 2 млрд книжек, подходящих сейчас в общественной коллекции Internet Archive. Благодаря технологиям автоматического зрительного узнавания текста к каждому извлечённому изображению привязано около 500 слов, идущих до и после него в книжке — иначе говоря, по коллекции можно производить текстовый поиск.

После прибавления обозначенных 14 млрд фотографий коллекция на Flickr будет регулярно укомплектовываться свежими снимками из не менее чем 1000 свежих книжек, сканируемых каждый день Internet Archive. Глава Библиотеки Уэлкома Врач Саймон Чаплин (Sion Chaplin) подчеркивает, что свежие методы поиска фотографий считаются огромным шагом вперёд и откроют для свежих аудиторий коллекцию оцифрованных книжек.

В собрании Internet Archive находятся книжки за не менее чем 500 лет. В дальнейшем эксперты рассчитывают сделать данную коллекцию ещё не менее любопытной — повысить количество фотографий, добавить подкатегории, и применять определенные средства теста фотографий, чтобы достичь улучшенного изображения и каталогизации.

Вы можете оставить комментарий, или ссылку на Ваш сайт.

Оставить комментарий