چرا اولین پاسخ ChatGPT همیشه بهترین پاسخ نیست؟

آموزش پرامپت نویسی هوش مصنوعی؛

تکنیک Self-Critique یا Prompt Loop چگونه کیفیت پاسخ‌های ChatGPT را افزایش می‌دهد؟

آموزش پرامپت نویسی هوش مصنوعی یکی از مهارت های مورد نیار در عصر دیجیتال است. در سال‌های اخیر، هوش مصنوعی مولد از یک فناوری تخصصی به ابزاری روزمره برای میلیون‌ها نفر تبدیل شده است. امروز دانشجویان برای تحقیق، برنامه‌نویسان برای تولید کد، تولیدکنندگان محتوا برای نگارش مقاله و حتی مدیران کسب‌وکار برای تصمیم‌گیری از مدل‌های زبانی مانند ChatGPT استفاده می‌کنند. با وجود این استقبال گسترده، بسیاری از کاربران پس از مدتی به یک نتیجه مشترک می‌رسند؛ اینکه کیفیت پاسخ‌های هوش مصنوعی همیشه ثابت نیست.

ممکن است یک روز با یک پرامپت ساده، مقاله‌ای دقیق و منسجم دریافت کنید و روز دیگر، همان درخواست با کیفیتی پایین‌تر پاسخ داده شود. همین تجربه باعث شده است که مفهوم آموزش پرامپت نویسی هوش مصنوعی به یکی از مهم‌ترین موضوعات دنیای فناوری تبدیل شود. امروزه دیگر تفاوت میان کاربران حرفه‌ای و کاربران عادی در انتخاب مدل نیست، بلکه در نحوه گفت‌وگو با مدل‌های زبانی است.

در ماه‌های اخیر نیز تکنیکی با نام‌های Prompt Loop، Self-Critique یا Reflection Prompting در شبکه‌های اجتماعی بسیار مورد توجه قرار گرفته است. در بسیاری از آموزش‌ها گفته می‌شود به جای آنکه مستقیماً از ChatGPT بخواهید مقاله یا کد تولید کند، ابتدا از آن بخواهید چندین گزینه ایجاد کند، سپس خودش خروجی را ارزیابی کند، نقاط ضعف را پیدا کند و در نهایت نسخه اصلاح‌شده را ارائه دهد.

اما آیا این روش واقعاً بر پایه اصول علمی بنا شده است یا تنها یک ترفند تبلیغاتی برای جذاب‌تر نشان دادن پرامپت‌هاست؟ برای پاسخ به این سؤال ابتدا باید بدانیم مدل‌های زبانی چگونه فکر می‌کنند و چرا اولین پاسخ آن‌ها همیشه بهترین پاسخ ممکن نیست.

سرویس آموزش هوش مصنوعی از خبر ICT از شما دعوت می کند این آموزش جذاب و کاربردی را دنبال کنید.

نویسنده : مهدی گمرکی

مدل‌های زبانی چگونه پاسخ تولید می‌کنند؟

یکی از بزرگ‌ترین سوءبرداشت‌ها درباره هوش مصنوعی این است که تصور می‌شود ChatGPT مانند یک موتور جست‌وجو یا یک پایگاه دانش عمل می‌کند و پاسخ صحیح را از میان اطلاعات خود استخراج می‌کند. در حالی که واقعیت کاملاً متفاوت است.

مدل‌های زبانی بزرگ (Large Language Models) هنگام دریافت یک درخواست، پاسخ آماده‌ای در اختیار ندارند. آن‌ها متن را کلمه به کلمه یا دقیق‌تر، توکن به توکن تولید می‌کنند. در هر مرحله، مدل احتمال هزاران توکن ممکن را محاسبه کرده و محتمل‌ترین گزینه را انتخاب می‌کند. سپس همین فرایند برای توکن بعدی تکرار می‌شود تا پاسخ کامل شکل بگیرد.

به همین دلیل، نخستین پاسخ تولیدشده را نباید «بهترین پاسخ ممکن» دانست؛ بلکه باید آن را «یکی از پاسخ‌های محتمل» در فضای بسیار بزرگی از پاسخ‌های ممکن تلقی کرد. این نکته اساس بسیاری از تکنیک‌های پیشرفته در آموزش پرامپت نویسی هوش مصنوعی است.

وقتی این سازوکار را درک کنیم، متوجه می‌شویم چرا تغییرات کوچک در متن پرامپت یا درخواست بازبینی خروجی می‌تواند پاسخ متفاوت و گاهی بسیار بهتری ایجاد کند.

چرا اولین پاسخ همیشه بهترین پاسخ نیست؟

فرض کنید از یک نویسنده حرفه‌ای بخواهید مقاله‌ای درباره امنیت سایبری بنویسد. احتمال زیادی وجود دارد که او پس از پایان نگارش، متن خود را دوباره بخواند، اشکالات نگارشی را اصلاح کند، بخش‌هایی را جابه‌جا کند و در نهایت نسخه نهایی را منتشر کند. تقریباً هیچ نویسنده حرفه‌ای اولین پیش‌نویس را بدون بازبینی منتشر نمی‌کند.

مدل‌های زبانی نیز از این قاعده مستثنا نیستند. اگر از مدل بخواهید تنها یک بار پاسخ تولید کند، در واقع اولین پیش‌نویس آن را دریافت کرده‌اید. اما اگر از آن بخواهید همان پاسخ را دوباره بررسی کند، نقاط ضعف را استخراج کند و نسخه‌ای کامل‌تر ارائه دهد، شبیه آن است که از نویسنده بخواهید متن خود را ویرایش کند.

اینجاست که تکنیک Self-Critique وارد عمل می‌شود.

تکنیک Self-Critique دقیقاً چیست؟

Self-Critique را می‌توان «خودنقدی هدایت‌شده» ترجمه کرد. در این روش، مدل زبانی تنها وظیفه تولید پاسخ را بر عهده ندارد، بلکه پس از تولید پاسخ، نقش یک منتقد یا ویراستار را نیز ایفا می‌کند.

نکته مهم این است که هدف اصلی این تکنیک، گرفتن یک نمره از مدل نیست. هدف، وادار کردن مدل به بازنگری در استدلال و خروجی خود است.

به بیان دیگر، مدل ابتدا نویسنده است، سپس منتقد می‌شود و در پایان دوباره نقش نویسنده را برای اصلاح متن بر عهده می‌گیرد. همین تغییر نقش باعث می‌شود توجه مدل به بخش‌هایی جلب شود که در مرحله نخست نادیده گرفته شده بودند.

به همین دلیل، بسیاری از پژوهشگران این روش را نه یک «ترفند پرامپت‌نویسی»، بلکه نوعی فرآیند چندمرحله‌ای برای افزایش کیفیت استدلال مدل می‌دانند.

Prompt Loop چیست و چه تفاوتی با Self-Critique دارد؟

در بسیاری از مقالات این دو اصطلاح به جای یکدیگر استفاده می‌شوند، اما از نظر مفهومی تفاوت ظریفی میان آن‌ها وجود دارد.

Prompt Loop بیشتر به ساختار اجرای چندمرحله‌ای اشاره دارد. در این روش، مدل ممکن است چندین بار تولید، ارزیابی و اصلاح را تکرار کند تا به نتیجه مطلوب برسد.

در مقابل، Self-Critique بر خودِ فرایند نقد و بازبینی تمرکز دارد. ممکن است این بازبینی تنها یک بار انجام شود یا در قالب چندین چرخه تکرار شود.

در عمل، بیشتر پرامپت‌هایی که در اینترنت با عنوان Prompt Loop منتشر می‌شوند، در حقیقت ترکیبی از این دو تکنیک هستند؛ یعنی مدل ابتدا خروجی تولید می‌کند، سپس آن را نقد می‌کند و در صورت نیاز نسخه جدیدی ارائه می‌دهد.

چرا تولید چند گزینه، کیفیت پاسخ را افزایش می‌دهد؟

یکی از رایج‌ترین نمونه‌های Prompt Loop این است که به جای درخواست مستقیم یک ایده، از مدل بخواهیم چندین ایده تولید کند و سپس آن‌ها را ارزیابی کند.

در نگاه اول ممکن است این کار بیهوده به نظر برسد. اگر در نهایت تنها یک ایده انتخاب می‌شود، چرا باید ده ایده تولید شود؟

پاسخ در نحوه تصمیم‌گیری مدل نهفته است.

هنگامی که مدل تنها موظف به ارائه یک پاسخ باشد، فضای جست‌وجوی آن محدود باقی می‌ماند. اما زمانی که از آن خواسته می‌شود ده گزینه مختلف تولید کند، ناچار است مسیرهای فکری متنوع‌تری را بررسی کند. پس از آن، با مقایسه این گزینه‌ها بر اساس معیارهای مشخص، احتمال انتخاب گزینه‌ای که هم خلاقانه‌تر باشد و هم ارزش بیشتری برای مخاطب ایجاد کند، افزایش می‌یابد.

به همین دلیل است که بسیاری از متخصصان تولید محتوا ابتدا از مدل می‌خواهند چندین عنوان مقاله پیشنهاد دهد و تنها پس از ارزیابی آن‌ها، نگارش مقاله را آغاز کنند.

این روش شباهت زیادی به جلسات طوفان فکری در تیم‌های حرفه‌ای دارد؛ ابتدا ایده‌ها تولید می‌شوند و سپس بهترین گزینه انتخاب و توسعه پیدا می‌کند.

آیا مدل واقعاً می‌تواند خودش را ارزیابی کند؟

این پرسش یکی از مهم‌ترین سؤالات در آموزش پرامپت نویسی هوش مصنوعی است.

پاسخ کوتاه این است: تا حدی بله، اما نه به عنوان یک داور مستقل.

مدلی که پاسخ را تولید کرده است، همان مدلی است که آن را ارزیابی می‌کند. بنابراین طبیعی است که در برخی موارد نتواند تمام خطاهای خود را تشخیص دهد یا حتی به پاسخ ضعیف امتیاز بالایی بدهد.

به همین دلیل، متخصصان هوش مصنوعی توصیه می‌کنند هنگام استفاده از Self-Critique، تمرکز خود را از «عدد» به «استدلال» منتقل کنید.

اگر مدل بنویسد:

«کیفیت مقاله ۹.۸ از ۱۰ است.»

این جمله ارزش آموزشی چندانی ندارد.

اما اگر توضیح دهد:

«مقدمه بیش از حد طولانی است، ارتباط میان بخش سوم و چهارم ضعیف است و نتیجه‌گیری فاقد جمع‌بندی عملی است.»

در این صورت اطلاعات بسیار ارزشمندتری در اختیار شما قرار گرفته است، زیرا اکنون دقیقاً می‌دانید چه بخش‌هایی نیاز به اصلاح دارند.

به همین دلیل، کاربران حرفه‌ای معمولاً از مدل نمی‌خواهند فقط نمره بدهد؛ بلکه از آن می‌خواهند دلایل هر ارزیابی را نیز توضیح دهد.

چرا امتیازدهی به تنهایی کافی نیست؟

بسیاری از پرامپت‌هایی که در فضای مجازی منتشر می‌شوند، مدل را وادار می‌کنند به خروجی خود نمره‌ای بین یک تا ده اختصاص دهد. اگرچه این روش در نگاه اول جذاب به نظر می‌رسد، اما نباید تصور کرد که این اعداد بیانگر کیفیت واقعی هستند.

امتیازدهی تنها زمانی ارزشمند است که بر پایه معیارهای مشخص و همراه با تحلیل باشد. در غیر این صورت، عددی مانند «۹ از ۱۰» هیچ اطلاعات عملی در اختیار نویسنده قرار نمی‌دهد.

به همین دلیل، اگر قصد دارید کیفیت خروجی را افزایش دهید، بهتر است از مدل بخواهید برای هر معیار توضیحی مستند ارائه دهد و سپس بر اساس همان توضیحات متن را بازنویسی کند. در چنین حالتی، فرایند بازبینی از یک ارزیابی ظاهری به یک ویرایش واقعی تبدیل خواهد شد.

بهترین روش استفاده از Self-Critique در تولید محتوا

فرض کنید هدف شما تولید مقاله‌ای برای وب‌سایت است. اگر از مدل تنها بخواهید مقاله را بنویسد، معمولاً متنی قابل قبول دریافت خواهید کرد؛ اما این متن هنوز نسخه نهایی نیست.

در روش حرفه‌ای، ابتدا از مدل می‌خواهید ساختار مقاله را طراحی کند. سپس از او می‌خواهید هر بخش را از نظر انسجام، کامل بودن، دقت اطلاعات، تناسب با مخاطب و ارزش آموزشی بررسی کند. پس از آن، مدل موظف می‌شود تنها بخش‌هایی را که واقعاً نیاز به اصلاح دارند بازنویسی کند.

در این فرآیند، نقش مدل از یک نویسنده صرف به یک ویراستار فنی نیز تغییر می‌کند و همین تغییر نقش، کیفیت خروجی را به شکل محسوسی افزایش می‌دهد.

محدودیت‌های Prompt Loop که کمتر کسی درباره آن صحبت می‌کند

با وجود مزایای فراوان، Prompt Loop یک راهکار جادویی نیست.

یکی از مهم‌ترین محدودیت‌های این روش آن است که مدل همچنان در حال ارزیابی خروجی خودش است. بنابراین اگر خطایی در استدلال اولیه وجود داشته باشد، ممکن است همان خطا در مرحله بازبینی نیز تکرار شود.

محدودیت دیگر به بازنویسی‌های بیش از حد مربوط می‌شود. برخی کاربران تصور می‌کنند هرچه تعداد دفعات بازبینی بیشتر باشد، کیفیت نیز افزایش پیدا می‌کند. در عمل چنین اتفاقی همیشه رخ نمی‌دهد. پس از دو یا سه مرحله اصلاح، معمولاً بازده کاهش می‌یابد و مدل بیشتر به تغییر واژه‌ها یا بازنویسی‌های ظاهری می‌پردازد تا اصلاحات واقعی.

به همین دلیل، استفاده هوشمندانه از این تکنیک اهمیت بسیار بیشتری از تکرار بی‌پایان آن دارد.

سو گیری الگوریتمی نیز از دیگر مشکلات می تواند باشد

چه زمانی نباید از Prompt Loop استفاده کرد؟

استفاده از Prompt Loop برای هر نوع درخواست ضروری نیست. اگر هدف شما دریافت پاسخی کوتاه، یک تعریف ساده یا محاسبه‌ای مشخص باشد، اجرای چندین مرحله تولید و بازبینی تنها زمان و هزینه پردازش را افزایش می‌دهد.

در مقابل، زمانی که قرار است مقاله‌ای تخصصی، گزارش تحلیلی، مستند فنی، طرح کسب‌وکار، کد برنامه‌نویسی یا محتوایی با اهمیت بالا تولید شود، اختصاص یک مرحله برای نقد و اصلاح خروجی می‌تواند ارزش قابل توجهی ایجاد کند.

بنابراین، انتخاب این تکنیک باید متناسب با پیچیدگی مسئله باشد، نه صرفاً بر اساس یک الگوی ثابت.

جمع‌بندی؛ آیا Self-Critique آینده آموزش پرامپت نویسی هوش مصنوعی است؟

اگر بخواهیم تنها یک تغییر اساسی در شیوه استفاده از مدل‌های زبانی معرفی کنیم، آن تغییر احتمالاً همین خواهد بود: از مدل فقط پاسخ نخواهید؛ از آن بخواهید درباره پاسخ خود نیز فکر کند.

البته این به معنای آن نیست که مدل به یک داور بی‌طرف تبدیل می‌شود یا تمام خطاهای خود را تشخیص می‌دهد. اما تجربه عملی و پژوهش‌های انجام‌شده نشان می‌دهد که وادار کردن مدل به بازبینی، توضیح نقاط ضعف و اصلاح هدفمند خروجی، در بسیاری از وظایف پیچیده می‌تواند کیفیت نهایی را به شکل محسوسی افزایش دهد.

در نهایت، مهارت اصلی در آموزش پرامپت نویسی هوش مصنوعی نوشتن پرامپت‌های طولانی یا پیچیده نیست، بلکه طراحی یک فرآیند فکری برای مدل است؛ فرآیندی که در آن تولید، نقد، اصلاح و بازبینی به صورت هدفمند در کنار یکدیگر قرار می‌گیرند. هرچه این فرآیند دقیق‌تر طراحی شود، احتمال رسیدن به پاسخ‌هایی عمیق‌تر، منسجم‌تر و قابل اعتمادتر نیز افزایش خواهد یافت.

مطالعه موردی؛ چگونه یک پرامپت معمولی را به یک پرامپت حرفه‌ای تبدیل کنیم؟

اکنون که با مفاهیم Prompt Loop و Self-Critique آشنا شدیم، بهتر است ببینیم این تکنیک‌ها در عمل چگونه کیفیت پاسخ‌های هوش مصنوعی را افزایش می‌دهند.

فرض کنید تصمیم گرفته‌اید برای سرمایه‌گذاری، از هوش مصنوعی کمک بگیرید و از آن بخواهید چند ایده برای راه‌اندازی یک کسب‌وکار پیشنهاد دهد.

اولین چیزی که معمولاً به ذهن بیشتر کاربران می‌رسد، نوشتن یک درخواست بسیار ساده است.

نسخه اول؛ پرامپت ساده

«۱۰ ایده کسب‌وکار پیشنهاد بده.»

این درخواست کاملاً قابل فهم است و هوش مصنوعی نیز احتمالاً فهرستی از ایده‌های متداول مانند فروشگاه اینترنتی، آموزش آنلاین، تولید محتوا یا خدمات دیجیتال ارائه خواهد داد.

اما اگر کمی دقیق‌تر نگاه کنیم، متوجه می‌شویم مشکل اصلی از همین نقطه آغاز می‌شود. مدل هیچ شناختی از کاربر ندارد. نمی‌داند چه مقدار سرمایه در اختیار اوست، چه مهارت‌هایی دارد، هدفش درآمد کوتاه‌مدت است یا ساختن یک برند بلندمدت، و حتی مشخص نیست که قرار است کسب‌وکار آنلاین باشد یا سنتی.

در نتیجه، پاسخ هرچند از نظر نگارشی مناسب است، اما ارزش تصمیم‌گیری چندانی ندارد.

نسخه دوم؛ اضافه کردن زمینه

اکنون همان درخواست را کمی دقیق‌تر بیان می‌کنیم.

«من حدود ۳۰۰ میلیون تومان سرمایه دارم، چند سال در حوزه برنامه‌نویسی فعالیت کرده‌ام و می‌خواهم یک کسب‌وکار اینترنتی راه‌اندازی کنم که طی سه سال آینده قابلیت توسعه داشته باشد. با توجه به این شرایط، ۱۰ ایده مناسب پیشنهاد بده.»

تنها با اضافه کردن چند جمله، کیفیت پاسخ به شکل محسوسی تغییر می‌کند. اکنون مدل دیگر مجبور نیست درباره شرایط کاربر حدس بزند و می‌تواند پیشنهادهایی متناسب با سرمایه، مهارت و هدف او ارائه دهد.

با این حال، هنوز یک مشکل مهم باقی مانده است. هوش مصنوعی فقط ایده تولید کرده است؛ اما مشخص نیست کدام ایده واقعاً ارزشمندتر است.

نسخه سوم؛ وادار کردن مدل به تحلیل

در این مرحله به جای آنکه تنها از مدل بخواهیم ایده تولید کند، از آن می‌خواهیم درباره پیشنهادهای خود نیز فکر کند.

«با توجه به شرایط من، ۱۰ ایده کسب‌وکار پیشنهاد بده. سپس برای هر ایده توضیح بده چرا آن را انتخاب کرده‌ای، مهم‌ترین مزیت رقابتی آن چیست، چه ریسک‌هایی دارد و برای موفقیت در آن به چه مهارت‌هایی نیاز است.»

تفاوت این نسخه با نمونه قبلی در یک نکته ظریف است. در اینجا مدل دیگر صرفاً نقش تولیدکننده ایده را ندارد، بلکه باید برای هر پیشنهاد استدلال ارائه کند. همین موضوع باعث می‌شود پاسخ‌ها منطقی‌تر و کاربردی‌تر شوند.

اما هنوز می‌توان یک گام دیگر به جلو برداشت.

نسخه چهارم؛ استفاده از تکنیک Self-Critique

اکنون از مدل می‌خواهیم پس از پایان تحلیل، خروجی خود را نیز مورد ارزیابی قرار دهد.

«ابتدا ۱۰ ایده کسب‌وکار متناسب با شرایط من ارائه کن. سپس هر ایده را از نظر میزان سرمایه موردنیاز، سودآوری، ریسک بازار، امکان توسعه و شدت رقابت ارزیابی کن. اگر احساس می‌کنی یکی از پیشنهادها ضعف جدی دارد، دلیل آن را توضیح بده و در پایان تنها سه ایده‌ای را معرفی کن که بهترین توازن میان ریسک و فرصت را دارند.»

در این مرحله، هوش مصنوعی دیگر تنها پیشنهاددهنده نیست؛ بلکه نقش یک مشاور را نیز ایفا می‌کند. او باید پیشنهادهای خود را با معیارهای مشخص مقایسه کند و برای انتخاب نهایی استدلال ارائه دهد. در بسیاری از موارد، همین مرحله باعث حذف پیشنهادهای ضعیف و افزایش کیفیت پاسخ می‌شود.

نسخه پنجم؛ پرامپت حرفه‌ای

اکنون تمام مراحل قبلی را در قالب یک فرآیند منسجم ترکیب می‌کنیم.

«در نقش یک مشاور ارشد کسب‌وکار و سرمایه‌گذاری عمل کن. هدف، یافتن بهترین ایده برای راه‌اندازی یک کسب‌وکار اینترنتی متناسب با شرایط من است. ابتدا ۱۵ ایده مختلف پیشنهاد بده و ایده‌های تکراری یا کم‌ارزش را حذف کن. سپس برای هر ایده بازار هدف، سرمایه اولیه، مزیت رقابتی، زمان تقریبی رسیدن به سوددهی و مهم‌ترین ریسک‌ها را تحلیل کن. پس از پایان تحلیل، خروجی خود را دوباره بازبینی کن و اگر در استدلال‌ها یا اولویت‌بندی‌ها ضعف یا تناقضی مشاهده کردی، آن‌ها را اصلاح کن. در نهایت، تنها سه ایده نهایی را همراه با دلایل انتخاب هر کدام ارائه بده.»

اگر این پنج نسخه را با یکدیگر مقایسه کنید، متوجه می‌شوید که تفاوت اصلی در طول پرامپت نیست؛ بلکه در شیوه هدایت مدل است. در هر مرحله، اطلاعات بیشتری در اختیار هوش مصنوعی قرار می‌گیرد، معیارهای تصمیم‌گیری شفاف‌تر می‌شوند و از مدل خواسته می‌شود پیش از ارائه پاسخ نهایی، یک بار دیگر خروجی خود را با دیدی انتقادی بررسی کند.

همین تغییر کوچک در شیوه طراحی پرامپت، یکی از مهم‌ترین تفاوت‌های کاربران مبتدی و کاربران حرفه‌ای در استفاده از مدل‌های زبانی است. کاربران حرفه‌ای کمتر به دنبال یافتن «پرامپت جادویی» هستند؛ آن‌ها تلاش می‌کنند فرآیندی طراحی کنند که هوش مصنوعی را مرحله‌به‌مرحله به سمت تولید دقیق‌ترین و کاربردی‌ترین پاسخ هدایت کند.

نویسنده : مهدی گمرکی

مشاوره تجارت الکترونیکی