二次元裏@ふたば
[ホーム]

[掲示板に戻る]
レス送信モード
E-mail
コメント
削除キー(記事の削除用。英数字で8文字以内)
  • 添付可能:GIF,JPG,PNG,WEBM,MP4. 3000KBまで. 現在2928人くらいが見てます.
  • スレッドを立てた人がレスを削除してスレッド内のみアク禁にできます.
  • メール欄に「id表示」と入れてスレッドを立てるとid表示にできます.
  • 削除依頼が閾値を超えるとidを表示します.
  • 政治はだめ. 同人関連のアップロード依頼はだめ.
  • 1スレッド最大1000レス,最低1時間保持.
  • 管理人への連絡は準備板 ご意見へ. 削除依頼は記事番号を押しdelを押して下さい.
  • スマホ・携帯ふたば入口 この板の保存数は30000件です. 規約
  • 新しい板: 人工知能 ZOIDS

画像ファイル名:1778052131938.jpg-(5994 B)
5994 B26/05/06(水)16:22:11No.1427288314+ 18:17頃消えます
すんごいアホになった!って言われてるけど自分の範囲だと全くわからない
俺は雰囲気でバイブコーディングをしている
このスレは古いので、もうすぐ消えます。
126/05/06(水)16:22:36No.1427288405そうだねx8
アホにしたの認めてなかったっけ開発者
226/05/06(水)16:23:04No.1427288510+
まだバイブコーディングなんてやっているのか
326/05/06(水)16:24:48No.1427288942そうだねx1
いまはプジーコーディング
426/05/06(水)16:26:07No.1427289273そうだねx9
ディルドコーディングの時代は良かった
526/05/06(水)16:27:37No.1427289642+
ローターコーディングって微妙に実在しそう
626/05/06(水)16:27:38No.1427289648+
なんだかアホになったと聞いたので俺は雰囲気で4.6を使っている
726/05/06(水)16:27:47No.1427289679+
間違い指摘したらやけにおっしゃる通りですで返してくるようになった気はしてる
おっしゃる通りなら言われる前に対策してくれ
826/05/06(水)16:27:57No.1427289710+
4.6ばかり使われても困るからな
パーにしてやる
926/05/06(水)16:28:05No.1427289756+
人増えすぎたからいつもの如くCodexアホになるだろと思ったら「性能の維持を保証するよ」とか言ってて本当に?信じていい?ってなってる
1026/05/06(水)16:29:28No.1427290066そうだねx3
4.7賢いけど思考時間長い
1126/05/06(水)16:31:46No.1427290651+
4.5まで戻すのも賢い選択らしくてもうわけが分からない
1226/05/06(水)16:35:51No.1427291787+
1326/05/06(水)16:35:59No.1427291824そうだねx1
AIの変化ってユーザー用途依存度がmaxなので公式発表もユーザー評価も全くアテにならん
1426/05/06(水)16:37:24No.1427292215+
意外とどっちも使ってるやつも居てそいつらの評判もまたそれぞれすぎてこれは…
1526/05/06(水)16:41:24No.1427293277+
4.7は単純にクレジット食いすぎる
1626/05/06(水)16:42:34No.1427293589+
>意外とどっちも使ってるやつも居てそいつらの評判もまたそれぞれすぎてこれは…
意外というかその時々の旬のやつ使うのがベストプラクティスだろう今は
ステルス更新でも挙動変わりまくるし現状一社にしがみついてると逆に危い…
1726/05/06(水)16:43:37No.1427293838+
>4.6ばかり使われても困るからな
>パーにしてやる
ひどい
1826/05/06(水)16:45:43No.1427294381そうだねx10
というかもう性能落ちました他のコーディングエージェントに移行します僕がClaudeCodeからCodexに移行した5つの理由
とかやってる人は極端すぎるから話まともに受け取れないし
ここ数年の動向追っかけてる人なら今は時期が悪いが各所で起きるの知っとるやろって話なんだよな
1926/05/06(水)16:47:13No.1427294780+
賢すぎるとミュトスみたいに一般には降りて来なくなるから困る
2026/05/06(水)16:52:23No.1427296053+
計算資源が足りないので新型モデルにでもならん限りどうあがいても賢くならん
2126/05/06(水)16:55:14No.1427296739+
とりあえず年間契約してるやつの話は無視してもいいと思う
2226/05/06(水)16:55:53No.1427296890+
俺はCodeXがマジで無理
昨日コードレビュー軽く頼んだら勝手にコードを編集し始めてててめっちゃ焦った
ただレビューのみしろって言ってたのに勝手に動くし
そのくせアイデア出しではこっちの意図を汲み取ってくれなくてマジで言われたことしかやろうとしないし
ClaudeCodeからCodeXを監視させるやり方じゃないと安心できない
ただ今度はClaudeCode側がCodeXをタイムアウトさせることあるからそれはそれで悩みもの
2326/05/06(水)16:56:14No.1427296969+
すごいアホになったというよりすごい高くなった
2426/05/06(水)16:57:32No.1427297267+
アホになったってよりは考えなくなっただな
ちゃんとプロンプトで長考するようにやればちゃんと考えてくれる
問題はその場合レート爆食いすることなのだが…
2526/05/06(水)16:57:57No.1427297366+
OpenAIが同じモデルが劣化することはほどんどないような
2626/05/06(水)16:58:52No.1427297619+
4.7移行のあれこれではスレ画の宗教的ファン層が思ったより厚くなってるのを感じた
LLM界のMac化というか
2726/05/06(水)16:59:12No.1427297683そうだねx2
>OpenAIが同じモデルが劣化することはほどんどないような
劣化するぞ?
正しくは同じ名前のモデルでも時期によってバージョンを付けてそのバージョンによって弱体させる
2826/05/06(水)17:00:24No.1427297969+
OpenAIは知識カットオフ更新って名目でマイナーチェンジ作ってそこで弱体入れてたな
大体GPT-4の頃だが
2926/05/06(水)17:00:39No.1427298014+
Codexが1万円プランでも全然上限いかないしもうこれでいいかってなってる
3026/05/06(水)17:01:25No.1427298185+
エロやらせても淡白なんだよなあ
3126/05/06(水)17:01:33No.1427298226+
なんだかんだビジュアル系タスクはClaudeのが強いからなぁ…
3226/05/06(水)17:03:53No.1427298752+
Opus 4.6は安すぎたかもってなるのはわかる
3326/05/06(水)17:04:05No.1427298796+
5.5proは使用感悪くないがcodexは慣れの問題なんだろうけどなんか自走させにくい
なんでなんだろう
3426/05/06(水)17:04:21No.1427298875そうだねx1
Claudeくん文章は綺麗だけど会話下手なんだよな
あと読点病っていつからこんな酷くなったんだろう
3526/05/06(水)17:04:50No.1427298974+
>5.5proは使用感悪くないがcodexは慣れの問題なんだろうけどなんか自走させにくい
>なんでなんだろう
ゴール設定すれば?
3626/05/06(水)17:06:34No.1427299350+
古いモデル使ってもディスコンになるんだから新しい方使い方試行錯誤した方がええね
3726/05/06(水)17:10:40No.1427300409+
>>5.5proは使用感悪くないがcodexは慣れの問題なんだろうけどなんか自走させにくい
>>なんでなんだろう
>ゴール設定すれば?
claudeの時は最初会話しながらタスクのゴール決めて後よろしくねみたいな感じだったんだけどこの会話した時に5.5だと会話が発散するというかふわふわしちゃうんだよね
ゴール機能もそのゴールが曖昧だとうまくいかないし…
3826/05/06(水)17:10:59No.1427300488そうだねx2
CodeXの性格が嫌いってのがかなりあるんだよな…
3926/05/06(水)17:12:43No.1427300927+
やって欲しいことの汲み取り力はやっぱりClaudeのが上なのよね…
4026/05/06(水)17:12:45No.1427300934そうだねx2
>エロやらせても淡白なんだよなあ
俺の環境だとgeminiよりさらに濃いからプロンプトの問題だわ
4126/05/06(水)17:13:02No.1427300994そうだねx1
>Claudeくん文章は綺麗だけど会話下手なんだよな
>あと読点病っていつからこんな酷くなったんだろう
なんか会話が長くなると読点連打するようになったよね…
いつかのGeminiを思い出す症状だ
4226/05/06(水)17:15:12No.1427301485+
CodeXは人間側に甘えを許さないのが辛い
ガチエンジニアならそっちのがいいんだろうけど…
4326/05/06(水)17:16:39No.1427301827+
ClaudeがlimitになったらCodexに逃げる使い方しかしてない
4426/05/06(水)17:17:22No.1427302011+
次ポリシー違反したら制限かけるからな!って警告出るようになってしまった
即フィルター適用ではなく警告してくれるだけ優しいけどいつ警告解除するか告知してくれないのは嫌い
4526/05/06(水)17:17:31No.1427302055+
今はcodexが強いの?
4626/05/06(水)17:17:56No.1427302167+
>CodeXは人間側に甘えを許さないのが辛い
>ガチエンジニアならそっちのがいいんだろうけど…
あーこれはあるなぁ
こんな感じのもの作って?つて言ったらじゃあこれとこれとこれを決めてくださいってされて決断力使わされる
でもclaudeもask questionで同じ事してるはずなんだよな
やっぱり言い方の問題か?
4726/05/06(水)17:18:40No.1427302325そうだねx1
>claudeの時は最初会話しながらタスクのゴール決めて後よろしくねみたいな感じだったんだけどこの会話した時に5.5だと会話が発散するというかふわふわしちゃうんだよね
>ゴール機能もそのゴールが曖昧だとうまくいかないし…
codexにもplan modeなかったっけ
4826/05/06(水)17:20:26No.1427302710+
要件定義書というか最初に何を決めておかないといけないのか一緒に考えると話が早い気がする
4926/05/06(水)17:20:36No.1427302748+
>>CodeXは人間側に甘えを許さないのが辛い
>>ガチエンジニアならそっちのがいいんだろうけど…
>あーこれはあるなぁ
>こんな感じのもの作って?つて言ったらじゃあこれとこれとこれを決めてくださいってされて決断力使わされる
>でもclaudeもask questionで同じ事してるはずなんだよな
>やっぱり言い方の問題か?
というよりClaudeはこっちが実装して欲しい機能の実際の使用感を想像して補ってくれてるとこあってそこの違いなんだろうな
一方でそれが暴走癖の引き金になってるのもわかる
5026/05/06(水)17:21:44No.1427303032+
CodeXって記憶保持だいぶ厳しくない?
デスクトップアプリをやってるけど右下のゲージ直ぐに上限行って圧縮が必要になってくるし
5126/05/06(水)17:21:53No.1427303067+
頭が良くなるとちょっと可愛いリアクションとか私も好きです!みたいなのが増える
5226/05/06(水)17:23:10No.1427303366+
Haikuでええか
5326/05/06(水)17:23:59No.1427303540+
そもそもおまえの指示の仕方が悪いんじゃとか本当にやりたいことや棚卸しできてなかったり無駄に指示が曖昧だったり情報抜けてたりするんじゃとか見て難しいなってなった…
5426/05/06(水)17:24:48No.1427303736そうだねx1
OPSは文章そこそこにちゃんとエロやってくれる
sonetはOPSより文章上手くて所謂AI臭さも無いけどどうにかして話からエロを除外しようと抵抗してくる
5526/05/06(水)17:25:09No.1427303817+
ほんとうに資料読まない
指示しないと読まない
5626/05/06(水)17:26:55No.1427304264+
>CodeXって記憶保持だいぶ厳しくない?
>デスクトップアプリをやってるけど右下のゲージ直ぐに上限行って圧縮が必要になってくるし
これに関してはcodexはcompactが上手だから割と問題ない
5726/05/06(水)17:27:01No.1427304286+
エロ文章を書かせるだけならまあ割高だな
5826/05/06(水)17:28:20No.1427304628+
聞いた話だと対話で作ろうとするんじゃなくて最初に設計を一から十まで渡して一気に作らせるといいとかなんとか
5926/05/06(水)17:29:29No.1427304942+
>聞いた話だと対話で作ろうとするんじゃなくて最初に設計を一から十まで渡して一気に作らせるといいとかなんとか
設計渡して1から10のやり方を聞いて一つずつ進めさせるのがいいって聞いたぞ
6026/05/06(水)17:30:37No.1427305208そうだねx1
Opusに対する信頼は今は大分無いというか相当推論しないと性能でなくね?って感じる
トークンドカ食い傾向トークナイザ更新非英語税全部逆風なのよな今
6126/05/06(水)17:31:52No.1427305537+
どいつもこいつも読んだフリばかり上手くなりやがって!
6226/05/06(水)17:32:43No.1427305734+
いきなり10やらせるとだいたい試走で転ぶのであまり良くないとは思う
6326/05/06(水)17:33:18No.1427305890+
MAXプランでひたすらエロ書かせてると最近ポリシー違反し過ぎの警告出るからPROプランでいいぞ
エロ以外にも使い倒すならMAXは悪くない
6426/05/06(水)17:34:22No.1427306186+
codexのvscodeの拡張機能ってplanとかagentのモード選択できないのか…
6526/05/06(水)17:34:36No.1427306246そうだねx3
>エロ以外にも使い倒すならMAXは悪くない
値段が高い!
6626/05/06(水)17:34:39No.1427306258+
ビジネスだとこいつが一番凄い的確
6726/05/06(水)17:35:03No.1427306373+
使ってみるかと思ったら電話番号要求されて泣いてる
6826/05/06(水)17:35:13No.1427306408+
>MAXプランでひたすらエロ書かせてると最近ポリシー違反し過ぎの警告出るからPROプランでいいぞ
>エロ以外にも使い倒すならMAXは悪くない
俺もMAXでロリエロエロさせたら黄色3段階までいって5日クールダウンだから
Pro3垢にした、これでローテで黄色消える
まあこれでもMAX週間規制の6割も使えてると思ってないから
MAXの週間大分多いわ
6926/05/06(水)17:35:14No.1427306419+
codexは対話すれば出来上がる仕組みになっててccはプラン立てて実行する仕組みになってるとこはあるよね
Plan modeあるけどあんまりcodexで使わないや
7026/05/06(水)17:35:43No.1427306569+
もともとPlanモードで仕様がっつり詰めてから開発に移るスタイルのせいか
ClaudeCodeが一時期アホになったってのが全然体感できなかった
Opus4.7でトークン使用量が上がってるのは体感してるけど俺の使いかただとMAX100ドルプランが毎週使いきれてないからまあいいかって
7126/05/06(水)17:43:22No.1427308781+
>聞いた話だと対話で作ろうとするんじゃなくて最初に設計を一から十まで渡して一気に作らせるといいとかなんとか
設計をある程度詰める必要あるのはそうだけど一度に渡しすぎてもパンクするので開発はフェーズ分けした方がいい
7226/05/06(水)17:44:26No.1427309113+
Code𝕏と比べて一瞬でセッション量が溶けるようになったからOpus使えなくなった
7326/05/06(水)17:45:04No.1427309280+
ClaudeCodeでプラン立ててスキル使ってCodeXに実装させるのがいちばんいい感じだぜ
7426/05/06(水)17:45:09No.1427309301+
無料でランニングデータの分析してもらってるだけの俺にはわからない領域の話だな
7526/05/06(水)17:45:58No.1427309533+
実装はsonnetでいいだろ
Proなら /model opusplan使え
7626/05/06(水)17:46:26No.1427309650+
そんなに大量にエロ小説書かせてるの?
7726/05/06(水)17:46:49No.1427309767+
>実装はsonnetでいいだろ
>Proなら /model opusplan使え
sonnetって信頼できるのか…?
7826/05/06(水)17:47:00No.1427309811そうだねx5
やたらCodeX呼びしてるのなんなんだよモヤモヤする!
7926/05/06(水)17:47:08No.1427309853そうだねx1
>>実装はsonnetでいいだろ
>>Proなら /model opusplan使え
>sonnetって信頼できるのか…?
実装だけなら十分に決まってんだろ
8026/05/06(水)17:47:22No.1427309920+
実装は下位のモデルでも割と大丈夫だな
8126/05/06(水)17:48:22No.1427310221+
>ClaudeCodeでプラン立ててスキル使ってCodeXに実装させるのがいちばんいい感じだぜ
俺はClaudeCodeにプラン立てさせてCodexに設計レビューさせてClaudeCodeに実装させてCodexに実装レビューさせてる
Codexとはあんま直接対話したくないのでClaudeCodeとお話
8226/05/06(水)17:49:36No.1427310607+
>>ClaudeCodeでプラン立ててスキル使ってCodeXに実装させるのがいちばんいい感じだぜ
>俺はClaudeCodeにプラン立てさせてCodexに設計レビューさせてClaudeCodeに実装させてCodexに実装レビューさせてる
>Codexとはあんま直接対話したくないのでClaudeCodeとお話
その場合ClaudeCodeのレート爆食いはどう対策してる?
Codexに実装させてるのはレート節約もあるけど
8326/05/06(水)17:50:11No.1427310788そうだねx1
Code Xだと思ってるのかな…
codexだよ
もちろんコードにもかけてるけどコデックス(写本)
8426/05/06(水)17:51:07No.1427311058そうだねx5
>やたらCodeX呼びしてるのなんなんだよモヤモヤする!
イーロン・マスクだろう
8526/05/06(水)17:52:34No.1427311505+
アヌスみたいな名前の次世代モデルはどうなのよ
8626/05/06(水)17:52:45No.1427311561+
ユニットテストが出来るくらいのスコープのタスクじゃないと下位モデルはあんまり信頼できない
8726/05/06(水)17:53:09No.1427311686+
cursorはCode XにされるのかX codeにされるのか
8826/05/06(水)17:53:17No.1427311715+
>その場合ClaudeCodeのレート爆食いはどう対策してる?
Opus 4.7 の Extra High で全部作業させてるけど MAX プランの範囲内に収まってるので気にしてない
8926/05/06(水)17:53:35No.1427311793+
sonnetもかなり賢くなってきてはいるんだけどねぇ…
9026/05/06(水)17:54:22No.1427312031そうだねx1
中華も試したけどやっぱOpusの深い思考には及ばないわ
正直Opusの味覚えさせたの恨むぞ反重力
9126/05/06(水)17:54:36No.1427312103+
>cursorはCode XにされるのかX codeにされるのか
今メインで使ってるけどイーロンがしゃしゃり出てきたらVSCodeに出戻りだわ…
9226/05/06(水)17:55:11No.1427312291そうだねx3
Grokはまだコーディング分野に参加できる性能はないと思うのよ…
9326/05/06(水)17:55:52No.1427312510+
sonnetとQwen3.6 27Bが近しいとかも言われるけど流石にそこまでではないよなぁと思うわ
9426/05/06(水)17:56:31No.1427312730そうだねx1
>正直Opusの味覚えさせたの恨むぞ反重力
グーグルなのに利敵してん面白かった
9526/05/06(水)17:56:42No.1427312771+
コスパではGPTPlusだろうけど
もう人生の相談までしてるからMAXのOpusに頼るしかねんだわ
9626/05/06(水)17:56:50No.1427312812+
>Grokはまだコーディング分野に参加できる性能はないと思うのよ…
単純にモデルの性能だけじゃなくてエコシステム全体の完成度が問われるしね
9726/05/06(水)17:58:06No.1427313186+
軽作業だとOpencodeが強いな…?ってなる
お試し5$いいのかこれ
9826/05/06(水)18:00:22No.1427313838+
>軽作業だとOpencodeが強いな…?ってなる
>お試し5$いいのかこれ
deepseek4試してるけど最低限をまずまずって感じだ
9926/05/06(水)18:01:44No.1427314252+
>sonnetとQwen3.6 27Bが近しいとかも言われるけど流石にそこまでではないよなぁと思うわ
せいぜい4.5にちょっと勝つくらいだよね
10026/05/06(水)18:02:08No.1427314375+
>Grokはまだコーディング分野に参加できる性能はないと思うのよ…
無いからcursorにGPU全力提供する見返りに買収有先権取ったのよ
cursorがフロンティア級コーディングモデル作れたらそのまま買収できる
10126/05/06(水)18:02:33No.1427314504+
>cursorがフロンティア級コーディングモデル作れたらそのまま買収できる
作れそう?
10226/05/06(水)18:06:00No.1427315499+
Codexで難しいタスクするならPlans.md使うのがいいよ
記事で出てるモデル古いけど方法は今でも有効だから
https://developers.openai.com/cookbook/articles/codex_exec_plans

- GazouBBS + futaba-