「SWE-bench Verified」は2024年8月にOpenAIが公開したベンチマークで、AIのプログラミング能力を測る代表的な指標として広く使われてきました。新たな分析により、SWE-bench Verifiedには2つの重大な問題があり、「もはや最先端モデルの能力を正しく測定するべきベンチマークとして適切ではない」とOpenAIが提言しています。
「AIコーディングの理想と現実」――ITエンジニアの実体験を語るこんな資料が、はてなブックマークなどで話題だ。資料は、システム開発などを手掛けるジェイテックジャパン(東京都港区)の高丘知央CTOが、4月22日に公開したもの。AIコーディングを ...
AIコーディングやAIエージェントを使い倒したいのに、利用コストが想定外に膨らんで二の足を踏んでいる──そんな経験はないだろうか。そんなとき、考慮に入れたいのが中国製LLMの存在だ。フロンティアモデルとの性能差はわずかなのに、コストは同クラスで約1/ ...
CodexCLIでターミナルで動くAIアプリを作っているところPhoto:かみやまたくみAIを使えばプログラミングがわからなくてもアプリが作れる。生成AIが登場してそう言われるようになり、2026年の今もその流れは続いているかなーと思います。プログラ ...
CodexはOpenAIが開発したAIコーディングツールであり、2026年4月にリリースされたGPT-5.5もCodexに統合されています。新たに、OpenAIがCodexに対して与えたプロンプトの中に「ゴブリン・グレムリン・アライグマ・トロール・オ ...
「Vibe Coding」がソフトウェア開発の新しい手法として注目を集めている。AIに指示しながらコードを生成し、アプリケーションを構築していくものだ。ユーザーがコーディングの詳細を理解していなくともプログラムが可能で、誰もが開発者になれる。
インターネット専業銀行「みんなの銀行」(本社:福岡市)は2026年4月28日、マネーロンダリング対策業務を生成AIで省力化したと発表した。プログラミング未経験の行員が生成AIのコーディング支援の下、Excelマクロなどを内製した。一部の工程で7時間か ...
趣味で身の回りの不便を便利にするレベルのAI活用ではコードが動くか動かないか?だけでいいのであるが、少し難しくなってくると動かないものも出てくる。 とある準公的なAPIを取得するだけなのだがPythonでは取れるのに、PowerShellでは取れない。動く ...
今回のコラムでは、バイブコーディングに関する連載を続け、生成AIやLLMが採用するAIコーディングパーソナリティのタイプについて、その内部構造を知ることの重要性を検証する。もしこのAIコーディングスタイルの隠れた側面を認識していなければ、バイブ ...
AIコーディングに毎月いくら払っていますか? こんにちは、しらいはかせです。突然ですが、皆さんは「AIコーディング」に毎月いくら払っていますか? AICUの「生成AIクリエイター白書2025」(2025年11月)によると、コーディング支援を使っているアンケート ...
[株式会社みんなの銀行]Gemini 活用で特定業務の作業時間を47%削減、銀行全体の生産性向上・イノベーション創出を加速株式会社みんなの銀行(取締役頭取 永吉 健一、以下「みんなの銀行」)は、全従業員を対象に、 Google Cloud ...
今日、商用ソフトウェアの大半はオープンソースソフトウェア(OSS)を組み合わせて作られている。しかしAI(人工知能)技術の普及によって、この安全な開発を支えてきた構図そのものが崩れつつある。 アプリケーションセキュリティベンダーBlack Duck ...