1. Hadoop MapReduce Fundamentals

    Трейнинг, состоящий из пяти модулей, покрывает базовые понятия работы с Hadoop.

    Модуль 1

    • Что такое Hadoop?
    • Почему используют Hadoop?
    • Какие типы бизнес проблем решаются с помощью Hadoop?
    • Компании, использующие Hadoop
    • Что в ходит в состав Hadoop?
    • Hadoop Cluster HDFS Storage
    • Задача MapReduce - логическое представление
    • Экосистема Hadoop
    • Как и кем распостраняется ...

    Подробнее

  2. Книга, The Performance of Open Source Applications

    В свободном доступе появилась новая книга из серии Архитектура Open Source приложений - The Performance of Open Source Applications. В книге включены следующие разделы:

    The Performance of Open Source Applications,cover

    1. Introduction, Tavish Armstrong
    2. High Performance Networking in Chrome, Ilya Grigorik
    3. From SocialCalc to EtherCalc, Audrey Tang
    4. Ninja, Evan Martin
    5. Parsing XML at the Speed of Light, Arseny ...

    Подробнее

  3. scrapy-dblite, библиотека для хранения данных Scrapy в sqlite

    На выходных закончил работу над небольшой библиотекой для Scrapy, позволяющей упростить хранение данных (Scrapy Items) в sqlite базе данных без необходимости работы с базой на уровне SQL запросов.

    В качестве примера работы с библиотекой, рассмотрю простой пример, когда необходимо в базе данных хранить данные по неким продуктам, извлеченных с помощью ...

    Подробнее

  4. Простое преобразование XML в словарь на python

    Иногда для работы на python с XML файлами небольшого размера проще представить их в виде словаря. Небольшой код, который позволяет это достаточно просто сделать

    from lxml import etree
    
    def etree_to_dict(t):
    
        d = {t.tag : map(etree_to_dict, t.iterchildren())}
        d.update(('@' + k, v) for k, v in t.attrib.iteritems())
        text ...

    Подробнее

  5. Linux Container (LXC), контейнерная виртуализация

    Подборка кратких аннотаций, заметок, ссылок на документацию, статьи, видео, посвященные Linux Containers.

    LXC/Linux Containers представляют собой технологию виртуализации на уровне операционной системы для запуска нескольких изолированных экземпляров Linux на одном компьютере, на основе namespaces и cgroups. LXC не использует виртуальные машины, а создаёт виртуальное окружение с собственным пространством процессов ...

    Подробнее

  6. Видео с конференции PyOhio 2013

    27-28 июля 2013 прошла открытая конференция посвященная python. Ниже представлена выборка наиболее интерестных на мой взгляд презентаций

    diesel: Simple and Scalable Network Applications

    An introduction to writing client and server applications using the diesel network programming framework.

    Автор: Christian Wyglendowski

    Keeping library compatible with Python 2.6-3.4 using python-systemd ...

    Подробнее

  7. kvlite, доступна новая версия 0.6.2

    Долгое время единственным средством доступа к данным на kvlite, за исключением самой библиотеки, был cli доступ. Для простых документов его вполне хватало, но для сложных доментов с комплексной структурой явно было не достаточно. Для более удобного доступа к данным в формате kvlite, в версии библиотеки v0.6.2 был добавлен ...

    Подробнее

  8. kvlite, доступна новая версия 0.6.0

    Новая версия kvlite 0.6.0 доступна на pypi и github в master ветви. Я не стал выделять описание версии v0.5.1 от v0.6.0 так как разница между их выходами была не велика. Единственное отличие версии v0.6.0 от предыдущих, не функциональное. Оно больше связано с ...

    Подробнее

  9. Заметки про установку lxml через pip

    Уставка python библиотеки lxml через pip обычно не вызывает сложностей, достаточно набрать в командной строке

    pip install lxml
    

    Но для случаев когда в системе не установлены все необходимые для lxml библиотеки, в ходе установки могут появлятся ошибки:

    gcc -pthread -fno-strict-aliasing -DNDEBUG -g -fwrapv -O2 -Wall -Wstrict-prototypes -fPIC 
    -I/usr/include ...

    Подробнее

Страница 1 из 19 »

Ссылки

В Сети