ข้ามไปยังเนื้อหา

ภาพประกอบสำหรับงานวิจัยการขับขี่อัตโนมัติ

กำลังเขียน paper เกี่ยวกับ self-driving, autonomous driving (AD) หรือ ADAS — ไม่ว่าจะเป็น workshop submission, IEEE journal, arXiv preprint หรือบท thesis — และต้องการภาพฉากขับขี่ บางทีเป็น corner case lane-merge สำหรับงาน prediction บางทีเป็น unprotected left turn สำหรับ planner หรือ pedestrian crossing scenario สำหรับ perception evaluation

ภาพต้องมีคุณสมบัติดังนี้

  • สะอาด — ไม่มี background ที่ไม่เกี่ยวข้อง ไม่มี simulator screenshot ที่ดูเป็นเอกชน
  • Scalable — vector ไม่ใช่ PNG เป็นรอยหยัก
  • แก้ไขได้ทีหลัง — เมื่อ reviewer ขอ variant ภาพควรอัปเดตได้โดยไม่ต้องวาดใหม่ตั้งแต่ต้น

drawtonomy ออกแบบมาเพื่อสิ่งนี้โดยเฉพาะ

แต่ละเครื่องมือต่อไปนี้เป็นตัวเลือกที่ดีในสิ่งที่ถนัด และภาพ paper ที่ดีเยี่ยมจำนวนมากก็ถูกสร้างด้วยเครื่องมือเหล่านี้ทุกวัน drawtonomy มีจุดเด่นเฉพาะตัวคือแคนวาส 2D ที่รู้จัก lane / vehicle / pedestrian และแก้ไขได้เมื่อต้องการ revise

  • PowerPoint / Keynote เป็นตัวเลือกสากลสำหรับภาพในทุกสาขา ภาพ paper ที่สะอาดหลายชิ้นออกมาจากเครื่องมือเหล่านี้ แต่เป็น general-purpose จึงต้องสร้าง road geometry จาก primitive shape แทนที่จะมี lane semantics ติดตัวมา
  • Excalidraw / tldraw เป็น ไวท์บอร์ด ดิจิทัลที่ยอดเยี่ยมและใช้งานสะดวก เน้น generic diagramming จึง lane direction, lane connection และ dashed marking มักต้องวาดเองด้วยมือ
  • CARLA / SUMO screenshot เป็นตัวเลือกธรรมชาติเมื่อภาพต้องสะท้อน simulator ที่ใช้จริงในงาน เช่น ภาพ appendix ที่แสดงฉากที่ประเมินผล visual style ของ simulator เหมาะกับจุดประสงค์นั้น และบางครั้งอาจไม่เหมาะสำหรับ schematic figure ในเนื้อหาหลัก
  • TikZ ใน LaTeX เป็น gold standard สำหรับภาพ LaTeX-native ที่แม่นยำสมบูรณ์ ภาพที่ประณีตจำนวนมากใช้เครื่องมือนี้ ข้อแลกเปลี่ยนคือ compile-iterate loop ที่ใช้เวลานานกว่าต่อภาพเมื่อเทียบกับ direct-manipulation canvas

drawtonomy อยู่ระหว่าง slide tool กับ TikZ คือแคนวาส 2D ที่มี lane / vehicle / pedestrian shape ติดตัวมา ถ้า workflow ปัจจุบันผลิตภาพที่ดีอยู่แล้วด้วยเครื่องมือข้างต้น toolchain นั้นก็ใช้ได้ดี drawtonomy มีประโยชน์มากที่สุดเมื่อต้องการ domain-aware shape และ re-editability ในไฟล์เดียว

  1. Sketch เลน ด้วย Lane Tool คลิก centerline แล้ว drawtonomy สร้างขอบซ้ายและขวาอัตโนมัติ สำหรับ lane merge ให้วาดเลนที่รวมแยกต่างหากแล้วเชื่อม predecessor/successor ด้วย Next Lane
  2. วาง participant ยานพาหนะ คนเดินเท้า สัญญาณไฟ และทางม้าลายอยู่ใน toolbar ลากวางบนแคนวาสได้เลย
  3. แสดงการเคลื่อนที่ ใช้ Path arrow — Arrow style สำหรับ schematic สะอาด หรือ Band style สำหรับเน้น corridor — แสดง trajectory ที่ตั้งใจ
  4. Style สำหรับ grayscale journal หลายแห่งยังพิมพ์ grayscale Attribute Panel ให้ตั้ง color, opacity และ stroke แยกกัน เพื่อเลือก palette ที่อยู่รอดเมื่อแปลงเป็น grayscale
  5. บันทึกเป็น .drawtonomy.svg นี่คือรูปแบบที่ควรใช้เป็นค่าเริ่มต้น เป็น SVG ปกติที่ LaTeX เบราว์เซอร์ GitHub Markdown และ slide tool preview ได้โดยไม่ต้องแปลง และยัง re-editable ใน drawtonomy — เมื่อ reviewer ขอ “ภาพเดิมแต่สามเลนแทนสองเลน” เปิดไฟล์ที่บันทึกไว้ แก้สองอย่าง แล้ว export ใหม่ ไม่ต้องวาดใหม่
  6. Export raster เฉพาะเมื่อจำเป็น ถ้า venue ต้องการ PNG ให้ export PNG ด้วย high-DPI setting จาก scene เดิม เก็บไฟล์ .drawtonomy.svg เป็น source of truth ไม่ว่าจะเลือก path ไหน

ไฟล์ .drawtonomy.svg เป็น SVG ปกติที่มี metadata พิเศษ ดังนั้น path LaTeX ที่ใช้กับ SVG อื่นก็ใช้ได้กับไฟล์นี้เช่นกัน

  • \includegraphics{} ผ่าน svg package ใส่ไฟล์โดยตรงด้วย \includegraphics[width=\linewidth]{your-figure.drawtonomy.svg} แต่ toolchain svg package + inkscape อาจมีปัญหาบน CI สำหรับ build ที่คาดเดาได้ ให้แปลงเป็น PDF ครั้งเดียวบนเครื่องตัวเอง (inkscape --export-type=pdf your-figure.drawtonomy.svg) แล้ว \includegraphics{} PDF ที่ได้
  • Fonts ถ้าภาพมี font นอก standard set ให้ใช้ engine xelatex หรือเลือก path ที่ปลอดภัยกว่าคือ “ไม่มี text ใน SVG ทุก text อยู่ใน LaTeX caption”
  • Submission packaging หลาย venue ต้องการไฟล์ graphic เป็น .pdf หรือ .eps แปลง .drawtonomy.svg → PDF / EPS ตอน submit แต่เก็บ .drawtonomy.svg ไว้ใน repo เป็น source ที่แก้ไขได้สำหรับ revision

สำหรับภาพที่ใช้ทั้งใน paper และ slides

  • เก็บไฟล์ .drawtonomy.svg เป็น single source export .pdf สำหรับ paper ถ้า build ต้องการ และ .png (transparent background) สำหรับ slides ไฟล์เดิมเปิดได้เสมอสำหรับ revision รอบหน้า
  • ภาพ photorealistic (sensor rendering, neural-rendering results) ใช้ simulator screenshot pipeline ต่อไป
  • โครงข่ายเมืองหนาแน่น drawtonomy ไม่เหมาะ ให้ใช้ HD-map tool จริง
  • ภาพที่มีสไตล์สูง (cover art, สื่อการตลาด) Illustrator หรือ Affinity ให้การควบคุม typographic ที่ละเอียดกว่า