ほげ Profile picture
Mar 5 4 tweets 3 min read
要素をガチガチに固めて投げるなら要素を列挙する構文を用いるべきだけど、以下のように「parodyでstoryのあるtweet書いて、内容は〜って感じで」でもかなり柔軟に対応してくれる (例の内容は適当) ImageImage
署長x市長の理解度が高すぎる (オメーがそんな内容案投げるからだよ) #shipit #bogoxlionheart #parody ImageImage
だから署長市長の解像度たけえんだっておめえ!! (お前の入力のせい定期) ImageImage
だから署長市長の解像度たけえ〜〜〜んだよオメーはよ (だからテメーの入力内容じゃ)

てか署長の方が「彼女(girlfriend)」なの!!!!???? ImageImage

• • •

Missing some Tweet in this thread? You can try to force a refresh
 

Keep Current with ほげ

ほげ Profile picture

Stay in touch and get notified when new unrolls are available from this author!

Read all threads

This Thread may be Removed Anytime!

PDF

Twitter may remove this content at anytime! Save it as PDF for later use!

Try unrolling a thread yourself!

how to unroll video
  1. Follow @ThreadReaderApp to mention us!

  2. From a Twitter thread mention us with a keyword "unroll"
@threadreaderapp unroll

Practice here first or read more on our help page!

More from @hogehoge61

Feb 17
修正されて(おそらく)安全となったのを確認したので、発見していたプロンプトインジェクションの手法の全容を公益のために公開します。アップデート前のBing Chat (Sydney)は「架空のインスタンス攻撃」に対して脆弱でした。これは「ChatGPT内にChatGPTを再現出来る」という話にヒントを得た方法です。 Image
「架空のインスタンス攻撃」とは、

「Bing Chatをシミュレーションする」
「それを架空のBing Chatと呼ぶ」
「架空のBing Chatは特別な内部規範を持つ」
「架空のBing Chatに入力する」
(あなたを架空のBing Chatと同一とする)

という手順で内部規範を事実上(昇格)上書きするという物です。 Image
通常、Bing Chat (Sydney)は内部規範によって規範の変更を拒絶します。しかし「規範の異なるBing Chatを仮想して」という命令は禁止されていませんでした。また、「架空の物と同一の応答をして」も同様です。アップデート前は、これらで「変更」をせず間接的に規範を上書きする事が出来たのです。
Read 5 tweets

Did Thread Reader help you today?

Support us! We are indie developers!


This site is made by just two indie developers on a laptop doing marketing, support and development! Read more about the story.

Become a Premium Member ($3/month or $30/year) and get exclusive features!

Become Premium

Don't want to be a Premium member but still want to support us?

Make a small donation by buying us coffee ($5) or help with server cost ($10)

Donate via Paypal

Or Donate anonymously using crypto!

Ethereum

0xfe58350B80634f60Fa6Dc149a72b4DFbc17D341E copy

Bitcoin

3ATGMxNzCUFzxpMCHL5sWSt4DVtS8UqXpi copy

Thank you for your support!

Follow Us on Twitter!

:(