วิธีเปิดไฟล์ข้อความและ CSV ขนาดใหญ่จริงๆ

เผยแพร่แล้ว: 2021-10-24

MS Excel สามารถแสดงได้ 1,048,576 แถว แม้ว่าการใช้งานปกติอาจดูเหมือนเป็นจำนวนมาก แต่ก็มีสถานการณ์มากมายที่ไม่เพียงพอ

ไม่ว่าคุณจะกำลังดูไฟล์บันทึกหรือชุดข้อมูลขนาดใหญ่ ไฟล์ CSV ที่มีหลายล้านแถวหรือไฟล์ข้อความขนาดใหญ่ก็เป็นเรื่องง่าย เนื่องจาก Excel ไม่สามารถรองรับไฟล์ขนาดใหญ่นี้ได้ คุณจะเปิดไฟล์เหล่านั้นได้อย่างไร ลองหากัน

สารบัญ

    เหตุใดโปรแกรมแก้ไขข้อความปกติจึงไม่สามารถเปิดไฟล์ขนาดใหญ่ได้

    คอมพิวเตอร์มีพื้นที่เก็บข้อมูลเป็นกิกะไบต์ เหตุใดโปรแกรมแก้ไขข้อความจึงเปิดไฟล์ขนาดใหญ่ไม่ได้

    มีสองปัจจัยที่เล่นที่นี่ แอปพลิเคชั่นบางตัวมีขีด จำกัด ฮาร์ดโค้ดว่าสามารถแสดงข้อมูลได้มากน้อยเพียงใด ไม่สำคัญหรอกว่าพีซีของคุณมีหน่วยความจำมากแค่ไหน แต่ก็ใช้ไม่ได้

    ปัญหาที่สองคือ RAM โปรแกรมแก้ไขข้อความจำนวนมากไม่ได้จำกัดจำนวนแถวแบบตายตัว แต่ไม่สามารถแสดงไฟล์ขนาดใหญ่ได้เนื่องจากข้อจำกัดด้านหน่วยความจำ พวกเขาโหลดไฟล์ทั้งหมดลงใน RAM ของระบบ ดังนั้นหากหน่วยความจำนี้ไม่ใหญ่พอ กระบวนการก็จะล้มเหลว

    วิธีที่ #1: การใช้ตัวแก้ไขฟรี

    วิธีที่ดีที่สุดในการดูไฟล์ข้อความขนาดใหญ่มากคือการใช้... โปรแกรมแก้ไขข้อความ ไม่ใช่แค่โปรแกรมแก้ไขข้อความเท่านั้น แต่ยังเป็นเครื่องมือสำหรับเขียนโค้ดอีกด้วย แอพดังกล่าวมักจะสามารถจัดการไฟล์ขนาดใหญ่ได้โดยไม่มีปัญหาและฟรี

    โปรแกรมดูไฟล์ข้อความขนาดใหญ่น่าจะเป็นแอพพลิเคชั่นที่ง่ายที่สุด ใช้งานง่ายมาก ทำงานเร็ว และมีการใช้ทรัพยากรน้อยมาก ข้อเสียเพียงอย่างเดียว? ไม่สามารถแก้ไขไฟล์ได้ แต่ถ้าคุณต้องการดูเฉพาะไฟล์ CSV ขนาดใหญ่ นี่เป็นเครื่องมือที่ดีที่สุดสำหรับงานนี้

    สำหรับการแก้ไขไฟล์ข้อความขนาดใหญ่ด้วย คุณควรลองใช้ Emacs สร้างขึ้นสำหรับระบบ Unix ซึ่งทำงานได้ดีบน Windows เป็นอย่างดี และสามารถจัดการไฟล์ขนาดใหญ่ได้ ในทำนองเดียวกัน Neovim และ Sublime Text เป็น IDE น้ำหนักเบาสองตัวที่สามารถใช้เปิดไฟล์ข้อความ CSV ขนาดกิกะไบต์ได้

    หากสิ่งที่คุณกำลังมองหาคือค้นหาข้อมูลผ่านไฟล์บันทึกขนาดใหญ่ klogg เป็นเพียงเครื่องมือสำหรับคุณ แอปพลิเคชันนี้ช่วยให้คุณสามารถดำเนินการค้นหาที่ซับซ้อนผ่านไฟล์ข้อความขนาดใหญ่ได้อย่างง่ายดาย เนื่องจากไฟล์บันทึกที่สร้างโดยคอมพิวเตอร์มักจะมีหลายล้านแถว klogg จึงได้รับการออกแบบมาให้ทำงานกับขนาดไฟล์ดังกล่าวได้โดยไม่มีปัญหา

    วิธีที่ #2: แบ่งออกเป็นหลายส่วน

    ปัญหาทั้งหมดในการพยายามเปิดไฟล์ CSV ขนาดใหญ่คือไฟล์มีขนาดใหญ่เกินไป แต่ถ้าคุณต้องแยกไฟล์เหล่านี้เป็นไฟล์ขนาดเล็กหลายไฟล์ล่ะ

    นี่เป็นวิธีแก้ปัญหายอดนิยม เนื่องจากโดยทั่วไปไม่ต้องเรียนรู้อินเทอร์เฟซของโปรแกรมแก้ไขข้อความใหม่ คุณสามารถใช้ตัวแยก CSV ตัวใดตัวหนึ่งที่มีอยู่ออนไลน์เพื่อแยกไฟล์ขนาดใหญ่ออกเป็นไฟล์ที่ง่ายต่อการเปิดจำนวนหนึ่ง แต่ละไฟล์เหล่านี้สามารถเข้าถึงได้ตามปกติ

    อย่างไรก็ตาม นี่ไม่ใช่วิธีที่ดีที่สุดในการดำเนินการนี้ การแยกไฟล์ขนาดใหญ่มักจะทำให้เกิดการพิมพ์ผิดแปลก ๆ หรือไฟล์ที่กำหนดค่าอย่างไม่เหมาะสม นอกจากนี้ การเปิดแต่ละส่วนแยกกันจะป้องกันไม่ให้คุณกรองข้อมูลทั้งหมดในคราวเดียว

    วิธี #3: นำเข้าไปยังฐานข้อมูล

    ไฟล์ข้อความและ .csv ที่ขยายได้ถึงหลายกิกะไบต์มักเป็นชุดข้อมูลขนาดใหญ่ ทำไมไม่เพียงแค่นำเข้าลงในฐานข้อมูล?

    SQL เป็นภาษามาร์กอัปฐานข้อมูลที่ใช้บ่อยที่สุดในปัจจุบัน มี SQL หลายเวอร์ชันที่ใช้อยู่ แต่วิธีที่ง่ายที่สุดคือ MySQL และโชคดีที่มันเป็นไปได้ที่จะแปลงไฟล์ CSV เป็นตาราง MySQL

    นี่ไม่ใช่วิธีที่ง่ายที่สุดในการจัดการกับไฟล์ CSV ขนาดใหญ่ ดังนั้นเราขอแนะนำวิธีนี้เฉพาะในกรณีที่คุณต้องการจัดการกับชุดข้อมูลขนาดใหญ่เป็นประจำเท่านั้น หาก MySQL ฟังดูยากเกินไป คุณสามารถนำเข้าไฟล์ .csv ไปยัง MS Access แทนได้เสมอ

    วิธีที่ #4: วิเคราะห์ด้วย Python Libraries

    เมื่อคุณทำงานกับไฟล์ .csv ที่มีข้อมูลหลายล้านแถว คุณจะไม่สามารถทำความเข้าใจด้วยตนเองได้มากนัก คุณอาจต้องการกรองข้อมูลและเรียกใช้การสืบค้นข้อมูลเฉพาะเพื่อทำความเข้าใจแนวโน้ม

    เหตุใดจึงไม่เขียนโค้ด Python ให้ทำเช่นนั้นล่ะ

    อีกครั้งนี่ไม่ใช่วิธีที่ใช้งานง่ายที่สุด แม้ว่า Python จะไม่ใช่ภาษาการเขียนโปรแกรมที่ยากที่สุดในการเรียนรู้ แต่เป็นการเขียนโค้ด ดังนั้นจึงอาจไม่ใช่แนวทางที่ดีที่สุดสำหรับคุณ อย่างไรก็ตาม หากคุณพบว่าตัวเองต้องแยกวิเคราะห์ไฟล์ CSV ขนาดใหญ่ในแต่ละวัน คุณอาจต้องการทำให้งานเป็นอัตโนมัติด้วยโค้ด Python

    วิธีที่ #5: ด้วยเครื่องมือระดับพรีเมียม

    โปรแกรมแก้ไขข้อความที่เราเห็นในวิธีแรกไม่ใช่เครื่องมือเฉพาะสำหรับการประมวลผล CSV พวกมันเป็นเครื่องมือเอนกประสงค์ที่สามารถใช้ทำงานกับไฟล์ .csv ขนาดใหญ่ได้เช่นกัน

    แต่การใช้งานเฉพาะด้านล่ะ? ไม่มีแอพที่สร้างขึ้นเพื่อแก้ปัญหานี้หรือไม่?

    มีอยู่จริง. ตัวอย่างเช่น CSV Explorer สร้างขึ้นจากกระบวนการที่เราได้อธิบายไว้ในสองวิธีสุดท้าย (ฐานข้อมูล SQL และโค้ด Python) เพื่อสร้างแอปที่สามารถดูและแก้ไขไฟล์ CSV ขนาดใดก็ได้ คุณสามารถทำทุกอย่างที่คุณคาดหวังได้จากเครื่องมือสเปรดชีต เช่น สร้างกราฟหรือกรองข้อมูลใน CSV Explorer

    อีกทางเลือกหนึ่งคือ UltraEdit ไม่เหมือนกับเครื่องมือก่อนหน้านี้ ซึ่งไม่ได้มีไว้สำหรับไฟล์ .csv เท่านั้น แต่สำหรับไฟล์ข้อความทุกประเภท มันสามารถจัดการไฟล์ข้อความและ CSV ที่มีขนาดไม่กี่กิกะไบต์ได้อย่างง่ายดาย ด้วยอินเทอร์เฟซที่คล้ายกับโปรแกรมแก้ไขฟรีหลายตัวที่เราพูดถึงก่อนหน้านี้

    ข้อเสียเปรียบเพียงอย่างเดียวของเครื่องมือเหล่านี้คือมันเป็นแอปพลิเคชันระดับพรีเมียม ซึ่งคุณต้องได้รับใบอนุญาตแบบชำระเงินจึงจะสามารถใช้งานได้ คุณสามารถทดลองใช้เวอร์ชันทดลองฟรีเพื่อดูคุณลักษณะต่างๆ ได้ตลอดเวลา หรือหากคุณมีการใช้งานเพียงครั้งเดียว

    วิธีใดดีที่สุดในการเปิดไฟล์ข้อความขนาดใหญ่และไฟล์ CSV

    ในยุคของ Big Data นี้ ไม่ใช่เรื่องแปลกที่จะเรียกใช้ไฟล์ข้อความที่ทำงานเป็นกิกะไบต์ ซึ่งอาจเป็นเรื่องยากที่จะดูด้วยเครื่องมือในตัว เช่น Notepad หรือ MS Excel เพื่อให้สามารถเปิดไฟล์ CSV ขนาดใหญ่ได้ คุณต้องดาวน์โหลดและใช้แอปพลิเคชันบุคคลที่สาม

    หากคุณต้องการเพียงแค่ดูไฟล์ดังกล่าว Large Text File Viewer ก็เป็นตัวเลือกที่ดีที่สุดสำหรับคุณ สำหรับการแก้ไขจริงๆ คุณสามารถลองใช้โปรแกรมแก้ไขข้อความที่มีคุณลักษณะมากมาย เช่น Emacs หรือลองใช้เครื่องมือระดับพรีเมียม เช่น CSV Explorer

    เทคนิคต่างๆ เช่น การแยกไฟล์ CSV หรือการนำเข้าไปยังฐานข้อมูลนั้นมีหลายขั้นตอนเกินไป คุณควรได้รับใบอนุญาตแบบชำระเงินสำหรับเครื่องมือระดับพรีเมียมโดยเฉพาะ หากคุณพบว่าตัวเองต้องทำงานกับไฟล์ข้อความขนาดใหญ่เป็นจำนวนมาก