1. Pengenalan & Gambaran Keseluruhan
Integrasi Kecerdasan Buatan (AI) ke dalam rangkaian wayarles Generasi Keenam (6G) mewakili anjakan paradigma ke arah kecerdasan merata dan hiper-sambungan. Seperti yang digariskan dalam visi IMT-2030, 6G bertujuan untuk menyokong aplikasi intensif lebar jalur seperti realiti tambah, sistem autonomi, dan penyebaran IoT besar-besaran, dengan AI berfungsi sebagai pemacu teras. Walau bagaimanapun, konvergensi ini memperkenalkan satu cabaran kritikal: metrik kecekapan tenaga (EE) konvensional, yang biasanya ditakrifkan sebagai daya pemprosesan rangkaian per unit tenaga ($EE = \frac{Daya Pemprosesan}{Tenaga}$), gagal menangkap utiliti dan nilai tugas khusus AI, seperti yang dilakukan oleh Model Bahasa Besar (LLM). Kertas kerja ini memperkenalkan kerangka Kecekapan Tenaga Responsif Token (TREE), satu metrik baharu yang direka untuk merapatkan jurang ini dengan menggabungkan daya pemprosesan token model AI besar ke dalam pengiraan utiliti sistem, seterusnya memberikan ukuran yang lebih tepat bagi kemampanan tenaga untuk rangkaian 6G berintegrasi AI.
2. Kerangka TREE
Kerangka TREE mentakrifkan semula kecekapan tenaga untuk era AI. Ia melangkaui sekadar bit data untuk mempertimbangkan "token" pengiraan yang diproses oleh model AI sebagai pembawa utama utiliti dalam rangkaian pintar.
2.1 Definisi Metrik Teras
Metrik TREE asas dirumuskan sebagai nisbah utiliti tugas AI berkesan (diukur dalam token) kepada jumlah penggunaan tenaga sistem. Ia mengakui bahawa bukan semua trafik rangkaian membawa nilai yang sama; memproses token untuk perkhidmatan terjemahan bahasa masa nyata mempunyai utiliti dan implikasi tenaga yang berbeza daripada strim data video.
2.2 Prinsip Reka Bentuk
Kerangka ini menganalisis reka bentuk rangkaian melalui lensa tiga elemen AI kritikal:
- Kuasa Pengiraan: Sumber pengiraan teragih merentasi awan, pinggir, dan peranti hujung.
- Model AI: Seni bina, saiz, dan kecekapan model yang digunakan (cth., LLM, model penglihatan).
- Data: Isipadu, jenis, dan aliran data yang diperlukan untuk latihan dan inferens AI.
3. Analisis Teknikal
3.1 Formulasi Matematik
Metrik TREE yang dicadangkan boleh dinyatakan sebagai: $$\text{TREE} = \frac{\sum_{i \in \mathcal{A}} w_i \cdot U_i(T_i) + \sum_{j \in \mathcal{D}} w_j \cdot R_j}{P_{\text{total}}}$$ Di mana:
- $\mathcal{A}$ ialah set perkhidmatan AI dan $\mathcal{D}$ ialah set perkhidmatan data konvensional.
- $U_i(T_i)$ ialah fungsi utiliti untuk perkhidmatan AI $i$, bergantung pada daya pemprosesan tokennya $T_i$.
- $R_j$ ialah kadar data untuk perkhidmatan konvensional $j$.
- $w_i, w_j$ ialah faktor pemberat yang mencerminkan keutamaan perkhidmatan.
- $P_{\text{total}}$ ialah jumlah penggunaan kuasa sistem.
3.2 Seni Bina Sistem
TREE direka untuk seni bina awan-pinggir-hujung. Pertimbangan utama termasuk:
- Pemisahan & Penyerahan Model: Membahagikan pelaksanaan model AI secara dinamik antara pinggir dan awan berdasarkan kekangan tenaga dan kependaman untuk memaksimumkan TREE.
- Pembelajaran Teragih: Membolehkan latihan AI teragih sambil meminimumkan tenaga penghantaran data, yang secara langsung mempengaruhi penyebut TREE.
- Mampatan Model Adaptif: Menggunakan teknik seperti Penyesuaian Pangkat Rendah (LoRA) untuk mengurangkan kos tenaga pengiraan bagi penalaan halus model di pinggir.
4. Keputusan Eksperimen & Kajian Kes
Kertas kerja ini membentangkan kajian kes yang mengesahkan keupayaan unik TREE. Dalam senario trafik hibrid yang menggabungkan tugas inferens AI (cth., analisis video masa nyata) dengan aliran data tradisional (cth., muat turun fail), metrik EE konvensional terbukti tidak mencukupi. Ia gagal mendedahkan asimetri tenaga-perkhidmatan yang ketara—situasi di mana sejumlah kecil trafik AI bernilai tinggi menggunakan tenaga yang tidak seimbang berbanding trafik data isipadu tinggi bernilai rendah. TREE berjaya mengukur asimetri ini secara kuantitatif, memberikan pengendali rangkaian gambaran yang lebih jelas tentang di mana tenaga dibelanjakan berbanding nilai yang dihasilkan. Sebagai contoh, satu senario mungkin menunjukkan bahawa menyampaikan 1000 token untuk pembantu berasaskan LLM menggunakan tenaga setara dengan strim 1GB video, tetapi memberikan utiliti yang jauh berbeza, satu perbezaan yang hanya TREE dapat tangkap.
Pandangan Utama
- TREE mendedahkan ketidakcekapan tersembunyi dalam rangkaian yang menghidangkan trafik AI/data hibrid.
- Daya pemprosesan token adalah ukuran utiliti yang lebih bermakna daripada kadar bit mentah untuk perkhidmatan AI.
- Peruntukan sumber optimum untuk TREE mungkin berbeza dengan ketara daripada pemaksimuman EE tradisional.
5. Contoh Kerangka Analisis
Senario: Stesen pangkalan 6G menghidangkan dua perkhidmatan serentak: (1) perkhidmatan inferens LLM berasaskan pinggir untuk pemprosesan pertanyaan bandar pintar, dan (2) muat naik data sensor IoT latar belakang.
Langkah Analisis TREE:
- Takrifkan Utiliti: Tetapkan utiliti $U_1 = \alpha \cdot T_1$ (token diproses) untuk perkhidmatan LLM dan $U_2 = \beta \cdot R_2$ (bit dimuat naik) untuk perkhidmatan IoT. Pemberat $\alpha > \beta$ mencerminkan nilai yang lebih tinggi per unit perkhidmatan AI.
- Ukur Kuasa: Pantau jumlah kuasa $P_{total}$ yang digunakan oleh pengiraan (untuk LLM) dan komunikasi (untuk kedua-duanya).
- Kira & Bandingkan: Kira TREE = $(\alpha T_1 + \beta R_2) / P_{total}$. Bandingkan ini dengan EE tradisional = $(R_1 + R_2)/P_{total}$. Analisis ini kemungkinan besar akan menunjukkan bahawa memperuntukkan lebih banyak sumber kepada perkhidmatan LLM meningkatkan TREE lebih daripada EE tradisional, membimbing penjadualan sumber yang lebih pintar.
6. Analisis Kritikal & Pandangan Pakar
Pandangan Teras: Kertas kerja TREE bukan sekadar mencadangkan metrik baharu; ia secara asasnya mencabar kalkulus ekonomi dan kejuruteraan rangkaian masa depan. Ia betul mengenal pasti bahawa proposisi nilai 6G akan didominasi oleh AI-sebagai-Perkhidmatan, bukan sekadar paip yang lebih pantas. Mendasarkan kecekapan pada bit adalah seperti mengukur nilai perpustakaan dengan berat bukunya—ia sama sekali terlepas pandangan. Peralihan kepada token adalah langkah yang perlu, walaupun masih baru, ke arah rangkaian sedar-utiliti.
Aliran Logik: Hujahnya kukuh: 1) AI adalah teras kepada nilai 6G. 2) Nilai AI adalah dalam token/tugas, bukan bit. 3) Metrik lama (bit/Joule) oleh itu sudah lapuk. 4) Oleh itu, kita memerlukan metrik baharu (token/Joule). 5) Metrik baharu ini (TREE) mendedahkan masalah dan pertukaran pengoptimuman baharu. Logiknya menarik dan menangani titik buta yang ketara dalam penyelidikan 6G semasa, yang sering memperlakukan AI sebagai sekadar beban kerja lain dan bukannya pemacu nilai.
Kekuatan & Kelemahan: Kekuatan utama ialah pandangan jauh konseptual. Penulis melihat melangkaui halangan teknikal segera 6G kepada raison d'être terakhirnya. Kelemahannya, seperti mana-mana metrik perintis, ialah kebolehukuran praktikal. Bagaimana kita menyeragamkan fungsi utiliti $U_i(T_i)$? Token untuk GPT-4 tidak setara dengan token untuk penukar penglihatan ringan. Mentakrifkan dan bersetuju dengan pemberat utiliti ini merentasi vendor dan perkhidmatan akan menjadi kancah politik dan teknikal, mengingatkan cabaran dalam mengukur Kualiti Pengalaman (QoE). Tambahan pula, kerangka ini buat masa ini banyak bergantung pada inferens; kos tenaga besar latihan AI teragih dalam rangkaian, satu kebimbangan yang diketengahkan oleh kajian seperti dari inisiatif Machine Learning CO2 Impact, memerlukan integrasi yang lebih mendalam ke dalam kalkulus TREE.
Pandangan Boleh Tindak: Untuk pengendali rangkaian dan vendor peralatan, pengambilannya adalah mendesak: mulakan instrumentasi rangkaian dan platform AI anda untuk mengukur daya pemprosesan token dan mengaitkannya dengan penggunaan tenaga pada tahap terperinci. Projek perintis harus menguji algoritma penjadualan berpandukan TREE. Untuk badan piawaian (3GPP, ITU), kerja harus bermula sekarang untuk mentakrifkan kelas perkhidmatan berasaskan token dan pemprofilan utiliti, sama seperti kelas QoS ditakrifkan untuk 4G/5G. Mengabaikan ini dan berpegang pada EE tradisional adalah laluan pasti untuk membina rangkaian cekap tenaga yang tidak cekap secara ekonomi untuk era AI.
7. Aplikasi & Hala Tuju Masa Depan
Kerangka TREE membuka jalan untuk beberapa aplikasi dan hala tuju penyelidikan lanjutan:
- Pembahagian Rangkaian Dinamik: Mencipta bahagian rangkaian dioptimumkan AI dengan tahap TREE terjamin untuk perkhidmatan AI premium, berasingan daripada bahagian data usaha-terbaik.
- Pasaran AI Hijau: Membolehkan perdagangan sumber pengiraan dan inferens sedar-tenaga di pinggir rangkaian, di mana perkhidmatan membida berdasarkan keperluan utiliti berasaskan token mereka.
- Reka Bentuk Komunikasi dan Pengiraan Bersama: Mereka bentuk bersama protokol lapisan fizikal, seni bina rangkaian, dan seni bina model AI dari asas untuk memaksimumkan TREE, melangkaui paradigma semasa menyesuaikan AI kepada rangkaian sedia ada.
- Penilaian Kitaran Hayat: Memperluaskan TREE untuk merangkumi kitaran hayat penuh perkhidmatan AI dalam rangkaian, termasuk kos tenaga latihan model, kemas kini, dan pengurusan saluran data, mengintegrasikan konsep dari kajian analisis kitaran hayat.
- Pemiawaian Utiliti Token: Hala tuju masa depan utama ialah pembangunan piawaian seluruh industri untuk menentukur "utiliti" tugas AI yang berbeza, serupa dengan bagaimana pengekod video mentakrifkan metrik kualiti.
8. Rujukan
- ITU-R. “Framework and overall objectives of the future development of IMT for 2030 and beyond.” ITU-R M.[IMT-2030.FRAMEWORK], 2023.
- Zhou, Z., Chen, X., Li, E., Zeng, L., Luo, K., & Zhang, J. (2019). Edge intelligence: Paving the last mile of artificial intelligence with edge computing. Proceedings of the IEEE, 107(8), 1738-1762.
- Hu, E. J., et al. (2021). LoRA: Low-Rank Adaptation of Large Language Models. arXiv preprint arXiv:2106.09685.
- Lacoste, A., Luccioni, A., Schmidt, V., & Dandres, T. (2019). Quantifying the Carbon Emissions of Machine Learning. arXiv preprint arXiv:1910.09700.
- Wang, X., Han, Y., Leung, V. C., Niyato, D., Yan, X., & Chen, X. (2020). Convergence of edge computing and deep learning: A comprehensive survey. IEEE Communications Surveys & Tutorials, 22(2), 869-904.
- Zhu, J. Y., Park, T., Isola, P., & Efros, A. A. (2017). Unpaired image-to-image translation using cycle-consistent adversarial networks. In Proceedings of the IEEE international conference on computer vision (pp. 2223-2232). (Dirujuk sebagai contoh tugas AI intensif pengiraan yang kos tenaganya dalam konteks rangkaian akan lebih baik dinilai oleh TREE).