※ HDFS 1. Hadoop - 빅데이터 분산, 저장, 처리 시스템 - Java 언어로 작성되었고, Hadoop 기반의 프로그래밍은 자바를 사용 - 반드시 Java를 사용할 필요는 없음 - MapReduce: Java(비범용적, 복잡) / Python(범용적, 쉽고 간단) 2. Python을 이용하여 HDFS 활용 - Hadoop이 지원하는 hadoop-streamxxxxx.jar 기능 활용 - Map, Reduce를 연결할 때, 표준 입력 스트림/표준 출력 스트림을 사용 - 리눅스 상에서 파이프('|') 사용 ex) cat test.txt > copy.txt: 출력 방향이 모니터가 아닌 파일 cat test.txt >> copy.txt: copy.txt의 내용에 이어서 작성 cat test.py | ..