Существует общая задача чения информации из больших файлов. Для большинства популярных форматов эта операция достаточно проста. Исключением является xml. В сети можно нагуглить множества решений, все они чуть разные, чем-то отличаются друг от друга.
До недавнего времени не было какого-то конкретного, закомиченного решения. 4 месяца назад оно появилось. Ссылка специально не указана.
Большинство разработчиков рано или поздно заново решаеют такие задачи.
Несмотря на появление закомиченного образца, я предлагаю все же попробовать написать свое решение. Это хорошая академическая задача, с достаточно большим количеством подводных камней и мелочей.